3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
音声生成 / TTS GitHub ComfyUI-Qwen3-TTS
ComfyUI-Qwen3-TTSは、テキストを音声に変換するシンプルなテキスト読み上げアプリケーションです。中国語、英語、日…
★ 1 2026-06-29
ASR / 音声認識 GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識 GitHub AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識 GitHub phoneme
Phonemeは、Windowsユーザー向けのローカルファーストなボイスノートアプリケーションです。ホットキーを押すだけで…
★ 1 NOASSERTION 2026-06-23
マルチモーダル GitHub agents-connector
agents-connectorは、Claude Code、Codex、Gemini CLIといったAIエージェント間の連携を可能にするローカルメッセー…
★ 1 MIT 2026-07-02
画像生成 GitHub ai-horde-irc
AIHordeは、IRCチャンネル内でAI Hordeを利用した画像生成を可能にするIRCボットです。ユーザーはNickServ認証を通じ…
★ 1 MIT 2026-05-02
ASR / 音声認識 GitHub jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ComfyUI GitHub comfyui_gr85
comfyui_gr85 は、ComfyUI向けに作られた軽量なカスタムノード集です。画像サイズやアスペクト比の計算、シードベー…
★ 1 ⑂ 2 2025-11-28
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
音楽生成 GitHub SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 1 ⑂ 1 MIT 2026-06-26
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
動画生成 GitHub awesome-ai-app-promo-video-prompts
このGitHubリポジトリは、AIアプリのプロモーションビデオ、アプリデモ、アプリストア用クリエイティブのための実践…
★ 1 2026-04-28
3D / NeRF GitHub openclaw-sifu
openclaw-sifuは、OpenClawのインストールとアンインストールを簡素化するためのスタンドアロンのグラフィカルツール…
★ 1 2026-06-29
AIエージェント GitHub nipmod
Nipmodは、エージェントコードのための検証可能なパッケージレイヤーを提供します。Gitlawbをソースとするパッケージ…
★ 1 MIT 2026-06-13
LLM GitHub llama-google-colab-tutorial
本リポジトリは、MetaのLlama 3.1 8B InstructモデルをGoogle Colab上で無料で利用するためのステップバイステップチ…
★ 1 2026-03-18
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
AIエージェント GitHub ninja-harness
Ninja Harnessは、AIエージェントのプロダクション環境での信頼性、安全性、効率性を評価するための、トレースを重視…
★ 1 NOASSERTION 2026-06-06
動画生成 GitHub awesome-textideo
Textideoは、AIを活用してテキストや静止画から動画や画像を生成するツールです。テキストから魅力的な動画を作成し…
★ 1 ⑂ 1 MIT 2026-03-19
LLM GitHub tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ComfyUI GitHub mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12