3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub awesome-gemini-omni
このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…
★ 24 ⑂ 1 CC0-1.0 2026-05-31
マルチモーダル GitHub MOSAIC
MOSAICは、強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)、そして人間の意思決定者といった異な…
★ 24 ⑂ 4 MIT 2026-04-21
ComfyUI GitHub ComfyUI-LongCat-Avatar
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…
★ 24 ⑂ 2 MIT 2026-06-15
動画生成 GitHub awesome-video-diffusions
このツールは、arXivのビデオ拡散・ビデオ生成に関する最新研究論文、プロジェクト、リソースを自動更新で収集し、キ…
★ 24 2026-06-22
ASR / 音声認識 GitHub SayIt
SayItは、音声入力とAIによるテキスト修正(潤色)を組み合わせたオープンソースツールであり、Typelessの代替となる…
★ 24 ⑂ 4 AGPL-3.0 2026-07-03
ComfyUI GitHub ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 24 ⑂ 2 NOASSERTION 2026-05-04
3D / NeRF GitHub HairPort
HairPortは、画像内の顔に参照ヘアスタイルを転送する最先端の3D認識型フレームワークです。このツールは、大規模な…
★ 23 ⑂ 1 NOASSERTION 2026-06-12
音声生成 / TTS GitHub ElBruno.Realtime
「ElBruno.Realtime」は、.NET向けのプラグイン可能なリアルタイム音声会話フレームワークです。ローカルでVAD(音声…
★ 23 ⑂ 2 MIT 2026-05-05
音声生成 / TTS GitHub Jarvis
JARVISは、Tony StarkのAIアシスタントに触発されたMac上で動作するパーソナルAIアシスタントです。音声対話、映画の…
★ 23 ⑂ 7 2026-06-11
音声生成 / TTS GitHub claude-voice
このツールは、Claude CodeのAIチャットでClaudeの応答を音声で聞くための、完全にローカルなTTS(Text-to-Speech)…
★ 23 ⑂ 5 MIT 2026-06-15
動画生成 GitHub awesome-grok-imagine-prompts
このリポジトリは、xAIのGrok Imagine向けに厳選された高品質な動画生成プロンプト集です。映画のような映像、アクシ…
★ 23 ⑂ 2 NOASSERTION 2026-07-01
LLM GitHub gemini-cli-extension
Pinecone Gemini CLI拡張機能は、Pineconeの公式拡張ツールです。このツールを利用することで、ターミナルから直接、…
★ 23 ⑂ 1 MIT 2026-05-20
LLM GitHub provenant
Provenantは、AIコーディングエージェント向けに最適化されたローカルコードベースメモリソリューションです。コード…
★ 23 ⑂ 12 2026-05-28
画像生成 GitHub JustRayzist
JustRayzistは、Rayzist Z-Image Turboファインチューンを中心に構築された軽量なCUDAベースのローカル画像生成プラ…
★ 23 ⑂ 1 Apache-2.0 2026-05-19
マルチモーダル GitHub ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 23 NOASSERTION 2026-05-25
ASR / 音声認識 GitHub ariontalk
ArionTalkは、ウェブページに音声AIエージェントを追加するツールです。ユーザーがウェブページと自然な会話をできる…
★ 23 MIT 2026-04-30
動画生成 GitHub Hand2World
「Hand2World」は、自由空間での手のジェスチャーから一人称視点でのインタラクションを自動回帰的に生成する研究プ…
★ 23 2026-06-30
音声生成 / TTS GitHub mimo-mcp
mimo-mcpは、XiaomiのMiMo全モーダルAI機能(多モーダル対話、画像/動画理解、テキスト音声合成、音声クローン、音声…
★ 23 ⑂ 2 MIT 2026-06-28
ComfyUI GitHub comfyui_stereoscopic
comfyui_stereoscopic は、ComfyUI向けのカスタムノード、ワークフロー、補助スクリプトをまとめたパッケージで、通…
★ 23 ⑂ 5 NOASSERTION 2026-06-26
音楽生成 GitHub suno-cli
suno-cliは、人気のAI音楽生成サービスSunoのv5.5機能をターミナルからフル活用できるCLIツールです。Sunoの公式API…
★ 22 ⑂ 9 MIT 2026-05-04
動画生成 GitHub NextFrame
NextFrameは、AIを活用した革新的なビデオエディターおよびランタイムです。構造化されたJSONデータからビデオを生成…
★ 22 ⑂ 8 MIT 2026-04-26
LLM GitHub EEP
EEP(Entity Engagement Protocol)は、デジタルエンティティとそれに追従するクライアント(エージェント)間の、プ…
★ 22 ⑂ 6 Apache-2.0 2026-07-01
ASR / 音声認識 GitHub anti-vocale
Anti-Vocaleは、Androidデバイス上で動作する音声メッセージ文字起こしアプリです。WhatsAppやTelegramなどから共有…
★ 22 MIT 2026-06-29
ASR / 音声認識 GitHub shorts-saver-bot
「YouTube Shorts Bot」は、YouTubeショート動画のURLを処理し、AI(LLMとオプションのVision機能)を活用して動画か…
★ 22 ⑂ 10 MIT 2026-05-14