3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成
GitHub
sanatation
NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…
★ 2 Apache-2.0 2026-05-21
動画生成
GitHub
article-to-podcast
このツールは、Markdown形式で書かれた記事を自動的にMP3形式のポッドキャストとMP4形式のスライドショー動画に変換…
★ 2 2026-05-06
AIエージェント
GitHub
SYNAPSE
SYNAPSE Intelligence Platformは、自律型AIエージェントと高度なセマンティック検索(RAG)を駆使し、FAANGグレード…
★ 2 MIT 2026-06-04
AIエージェント
GitHub
opus-magnum
Opus Magnum Claude Codeは、長期にわたる複雑なAIコーディングプロジェクトを、コンテキストの損失やエージェントの…
★ 2 MIT 2026-06-11
画像生成
GitHub
dreamina-web-interface
DreamWeaver CLIは、テキストによる指示を視覚的な作品に変えるインテリジェントなコマンドラインツールです。参照画…
★ 2 2026-06-26
ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ASR / 音声認識
GitHub
Murmur
Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…
★ 2 ⑂ 2 NOASSERTION 2026-06-22
ASR / 音声認識
GitHub
Vox
Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…
★ 2 ⑂ 2 MIT 2026-05-24
マルチモーダル
GitHub
rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
ComfyUI
GitHub
Agnes
Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…
★ 2 MIT 2026-06-06
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
ComfyUI
GitHub
ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
画像生成
GitHub
chatwalaau
ChatWalaʻauは、完全にローカルで動作するフルスタックAIエージェントランタイムです。最新のチャットUIをAG-UIプロ…
★ 2 Apache-2.0 2026-06-27
3D / NeRF
GitHub
EasyTraceSTL
EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…
★ 2 2026-06-17
画像生成
GitHub
zimage-skill
zimage-skillは、自然言語のテキスト記述からAIが美しい画像を生成するツールです。プログラミングの知識がなくても…
★ 2 MIT 2026-06-27
AIエージェント
GitHub
neon-shadows
「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…
★ 2 2026-05-18
ASR / 音声認識
GitHub
rust-whisper-diarization
rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。whisper.c…
★ 2 2026-05-23
3D / NeRF
GitHub
3dgs-detail-zoom-annotator
「3DGS Detail Zoom Annotator」は、3DGS(3D Gaussian Splatting)やNeRF、3D再構築などの研究論文における図表作成…
★ 2 MIT 2026-03-26
ASR / 音声認識
GitHub
deckle
Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…
★ 2 MIT 2026-06-16
マルチモーダル
GitHub
sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
ComfyUI
GitHub
ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
ASR / 音声認識
GitHub
macOS-dictate
macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…
★ 2 MIT 2026-06-25
音声生成 / TTS
GitHub
lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 2 2026-06-18
LLM
GitHub
GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 2 2026-05-13