3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
diarize
diarizeは、音声ファイルから「誰がいつ話したか」を自動的に識別するPython製のスピーカーダイアリゼーションツール…
★ 91 ⑂ 8 Apache-2.0 2026-05-06
3D / NeRF
GitHub
superfit
SuperFitは、CVPR 2026で発表された、3D形状にSuperFrusta、直方体、超二次曲面といったコンパクトなプリミティブア…
★ 89 ⑂ 5 NOASSERTION 2026-05-23
画像生成
GitHub
SD-Anima-Prompt-Studio
SD-Anima-Prompt-Studioは、Stable DiffusionとAnimaのプロンプト作成を支援する、洗練されたガラスモフィズムデザイ…
★ 88 ⑂ 7 2026-06-02
ASR / 音声認識
GitHub
HearoPilot-App
HearoPilotは、Androidデバイス上で動作するオンデバイスAI会議アシスタントです。リアルタイムの音声文字起こしとLL…
★ 88 ⑂ 30 Apache-2.0 2026-06-10
ComfyUI
GitHub
ComfyUI-RookieUI
ComfyUI-RookieUIは、ComfyUIのカスタムノード拡張で、A1111(Automatic1111)スタイルのサイドバーUIとワークフロー…
★ 88 ⑂ 7 AGPL-3.0 2026-06-24
画像生成
GitHub
ReactiveGWM
ReactiveGWMは、プレイヤー操作とNPCの自律性を分離することで、ゲーム内のNPCをより動的に制御する新しいゲーム世界…
★ 87 ⑂ 10 2026-06-16
動画生成
GitHub
MobileI2V
「MobileI2V」は、画像から高品質な動画を高速で生成できるツールです。特にモバイルデバイスでの利用に最適化されて…
★ 87 ⑂ 5 Apache-2.0 2026-05-20
LLM
GitHub
OpenDocuments
OpenDocumentsは、GitHub、Notion、Google Drive、ローカルファイル、Webソースなど、分散した組織の知識ソースを統…
★ 87 ⑂ 15 MIT 2026-05-27
LLM
GitHub
SR-Agents
SR-Agentsは、大規模言語モデル(LLM)エージェントにおけるスキル検索拡張(SRA)の研究と評価を目的としたコミュニ…
★ 86 ⑂ 11 MIT 2026-05-21
音声生成 / TTS
GitHub
reels-af
REELS-AFは、AIマルチエージェントシステム「AgentField」上で構築されたAIネイティブな動画生成ツールです。記事URL…
★ 85 ⑂ 32 Apache-2.0 2026-06-05
LLM
GitHub
pmb
PMB (Personal Memory Brain)は、AIコーディングエージェント(Claude Code、Cursor、Codexなど)にローカルファース…
★ 85 ⑂ 10 Apache-2.0 2026-06-22
3D / NeRF
GitHub
guidance-for-open-source-3d-reconstruction-toolbox-for-gaussian-splats-on-aws
AWS向けオープンソース3D再構築ツールボックスは、画像や動画入力から3Dシーンやオブジェクトを再構築するためのエン…
★ 84 ⑂ 5 MIT-0 2026-06-25
ASR / 音声認識
GitHub
AriaType
AriaTypeは、デスクトップ向けの音声入力ツールで、話した内容をカーソルがある場所に直接テキストとして挿入します…
★ 84 ⑂ 7 AGPL-3.0 2026-06-29
動画生成
GitHub
agnes-video-generator
Agnes Video Generatorは、Agnes AIを活用したワンクリックAI動画生成ツールです。テキストのアイデアから複数のシー…
★ 84 ⑂ 16 MIT 2026-06-24
音声生成 / TTS
GitHub
volocal
Volocalは、iOSデバイス上で完全にローカルに動作する音声AIアプリです。STT(音声認識)からLLM(大規模言語モデル…
★ 84 ⑂ 8 MIT 2026-04-02
マルチモーダル
GitHub
openmelon
OpenMelonは、ターミナル上で動作するAIコンテンツ作成エージェントです。ユーザーは単一のターミナルセッション内で…
★ 84 ⑂ 10 Apache-2.0 2026-05-11
音声生成 / TTS
GitHub
narrator-ai-cli
Narrator AI CLIは、AIを搭載した動画ナレーションプラットフォーム「Narrator AI」のコマンドラインツールです。AI…
★ 83 ⑂ 17 MIT 2026-06-29
AIエージェント
GitHub
kstack
「kstack」は、Claude Code向けのスキルパックで、Kubernetesクラスターの監視、トラブルシューティング、監査をAIの…
★ 83 ⑂ 7 Apache-2.0 2026-05-08
LLM
GitHub
trove-ai
Trove AIは、中国のインターネットコンテンツに特化した自己ホスト可能なAI搭載型「後で読む」ツール兼知識ベースで…
★ 83 ⑂ 12 NOASSERTION 2026-06-22
画像生成
GitHub
Unify-Agent
「Unify-Agent」は、Web検索等で外部の知識を能動的に参照し、事実に忠実な画像を生成する統一マルチモーダルAIエー…
★ 83 ⑂ 4 MIT 2026-05-02
ASR / 音声認識
GitHub
trx
「crafter/trx」は、Whisperを活用してオーディオやビデオを書き起こすためのエージェントファーストなCLIツールです…
★ 83 ⑂ 15 MIT 2026-04-07
LLM
GitHub
Awesome-Diffusion-LLM
「Awesome-Large-Language-Diffusion-Models」は、大規模言語拡散モデル(dLLM)に関する研究論文を網羅的かつ体系的…
★ 83 ⑂ 14 2026-06-04
LLM
GitHub
granite-switch
「Granite Switch」は、IBM Researchが開発したオープンソースプロジェクトで、複数のファインチューニングされたLoR…
★ 81 ⑂ 8 Apache-2.0 2026-06-24
ComfyUI
GitHub
comfyui-sdnq
「ComfyUI-SDNQ」は、ComfyUIユーザーが大規模な画像生成モデルを少ないVRAMで効率的に実行するためのツールです。本…
★ 81 ⑂ 13 GPL-3.0 2026-04-13