3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub hobnob
Hobnobは、クラウドやインターネット接続を必要としない、プライバシーを重視したデスクトップ会議メモアプリです。…
★ 7 NOASSERTION 2026-06-12
動画生成 GitHub firered-director
firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…
★ 7 MIT 2026-05-20
LLM GitHub CRIMENET
CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…
★ 7 MIT 2026-06-28
音声生成 / TTS GitHub Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-23
音声生成 / TTS GitHub shotfun-creator
shotfun-creatorは、画像、動画、音声、デジタルヒューマンといった多様なAIコンテンツ制作を網羅するスキル集です。…
★ 7 ⑂ 1 NOASSERTION 2026-05-29
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
画像生成 GitHub comfyui-lora-FindingLora
「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…
★ 7 ⑂ 2 2026-06-07
音声生成 / TTS GitHub book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
動画生成 GitHub Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
ASR / 音声認識 GitHub SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 7 ⑂ 2 AGPL-3.0 2026-06-02
ASR / 音声認識 GitHub tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
画像生成 GitHub sd-ai
SD Studioは、Stable DiffusionとLLMを統合したAI搭載デスクトップアプリケーションです。自然言語で指示を出すだけ…
★ 7 AGPL-3.0 2026-06-29
ASR / 音声認識 GitHub Scripta
Scriptaは、macOS向けのプライバシーを重視した会議用文字起こし&AI要約ツールです。マイクとシステムオーディオの…
★ 7 ⑂ 1 MIT 2026-05-21
音声生成 / TTS GitHub Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
画像生成 GitHub claude-skill-codex-imagegen
「claude-skill-codex-imagegen」は、AIアシスタント「Claude Code」にOpenAIの高性能画像生成モデル「gpt-image-2」…
★ 7 MIT 2026-05-16
音声生成 / TTS GitHub oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19
ComfyUI GitHub ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub gb-speech
「paladin-t/gb-speech」は、ゲームボーイ向けのリアルタイム音声シンセサイザーです。リアルな人の声ではなく、「ト…
★ 7 MIT 2026-05-03
ASR / 音声認識 GitHub VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 7 AGPL-3.0 2026-05-20
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
マルチモーダル GitHub 35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
ASR / 音声認識 GitHub hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10