3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
pi-listens
@p8n.ai/pi-listensは、音声認識(STT)と音声合成(TTS)機能を提供する、音声ファーストのPiパッケージです。デフ…
★ 2 MIT 2026-05-11
ASR / 音声認識
GitHub
openwritr-windows
OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…
★ 2 MIT 2026-06-12
画像生成
GitHub
ComfyUI-AliAn-Ideogram-Magic-Prompt
このツールは、ComfyUIのカスタムノードとして機能し、Ideogramのホスト型Magic Prompt APIを利用して、一般的なテキ…
★ 2 MIT 2026-06-04
動画生成
GitHub
ai-content-automation-system
このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…
★ 2 NOASSERTION 2026-05-10
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-23
LLM
GitHub
schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
音声生成 / TTS
GitHub
Supertonic-Voice
Supertonic Voiceは、PySide6とローカルONNX AI音声モデルで構築された、オフラインのデスクトップ音声合成(TTS)ア…
★ 2 MIT 2026-06-16
LLM
GitHub
modelfaucet
ModelFaucetは、オープンソースのLLM配信ゲートウェイと組み込み可能なSDKです。あらゆるウェブサイト、アプリケーシ…
★ 2 NOASSERTION 2026-06-22
ASR / 音声認識
GitHub
voice-sentiment-analysis
このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…
★ 2 ⑂ 1 2026-04-21
動画生成
GitHub
article-to-podcast
このツールは、Markdown形式で書かれた記事を自動的にMP3形式のポッドキャストとMP4形式のスライドショー動画に変換…
★ 2 2026-05-06
AIエージェント
GitHub
SYNAPSE
SYNAPSE Intelligence Platformは、自律型AIエージェントと高度なセマンティック検索(RAG)を駆使し、FAANGグレード…
★ 2 MIT 2026-06-04
AIエージェント
GitHub
opus-magnum
Opus Magnum Claude Codeは、長期にわたる複雑なAIコーディングプロジェクトを、コンテキストの損失やエージェントの…
★ 2 MIT 2026-06-11
LLM
GitHub
augmenting_historians
このPythonスクリプト群は、歴史家が自身の原稿を批判的に分析するための実験的なインフラストラクチャです。RAGアー…
★ 2 MIT 2026-06-22
AIエージェント
GitHub
job-copilot
プログラマー向けのAI面接コーチツール「JobCopilot」は、ユーザーが作成したMarkdown形式の技術ノートをプライベー…
★ 2 MIT 2026-05-24
画像生成
GitHub
dreamina-web-interface
DreamWeaver CLIは、テキストによる指示を視覚的な作品に変えるインテリジェントなコマンドラインツールです。参照画…
★ 2 2026-06-26
LLM
GitHub
Kymic
Kymicは、Model Context Protocol (MCP)とCode Mode実行パラダイムを利用した自律型AIオーケストレーションプラット…
★ 2 MIT 2026-03-29
ASR / 音声認識
GitHub
CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
音声生成 / TTS
GitHub
voice-ai-chat
このツールは、オープンソース技術(Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど)を基にゼロから構築された音声AI…
★ 2 MIT 2026-05-25
マルチモーダル
GitHub
rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
ComfyUI
GitHub
Agnes
Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…
★ 2 MIT 2026-06-06
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
ComfyUI
GitHub
ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
3D / NeRF
GitHub
EasyTraceSTL
EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…
★ 2 2026-06-17
画像生成
GitHub
zimage-skill
zimage-skillは、自然言語のテキスト記述からAIが美しい画像を生成するツールです。プログラミングの知識がなくても…
★ 2 MIT 2026-06-27