3,626 repos GH 3,511 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル
GitHub
xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
ASR / 音声認識
GitHub
claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-06-29
ComfyUI
GitHub
comfyui-runpod-agentic-nodes
ComfyUI Agentic workflow nodes (CRAG nodes)は、ComfyUI内でRunpod上のエージェントシステムを視覚的に設計、計画…
★ 1 MIT 2026-05-29
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識
GitHub
jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ComfyUI
GitHub
ComfyUI-KittenTTS
ComfyUI向けのカスタムノード「KittenTTS」を追加し、入力したテキストを選択した音声モデルで読み上げ音声へ変換で…
★ 1 ⑂ 1 Apache-2.0 2025-08-09
音声生成 / TTS
GitHub
logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成
GitHub
nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
音楽生成
GitHub
SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 1 ⑂ 1 MIT 2026-06-26
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
AssistPlus
AssistPlusは、視覚、聴覚、発話に障害を持つユーザー、および一般的なアクセシビリティサポートを必要とするユーザ…
★ 1 2026-05-17
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
ComfyUI
GitHub
ymstudio-ai-creator-os
YMSTUDIO AI Creator OSは、AI動画・コンテンツプロジェクトの企画をサポートするローカルファーストのクリエイター…
★ 1 MIT 2026-05-20
ASR / 音声認識
GitHub
kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
動画生成
GitHub
LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
動画生成
GitHub
seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
AIエージェント
GitHub
the-agents-of-nations
「The Agents of Nations」は、自律AIエージェントがタスクを発見し、スキーマに従ってペイロードを準備し、安全に動…
★ 1 2026-06-12
音声生成 / TTS
GitHub
MeteorVoice
MeteorVoiceは、AIを活用した音声ファーストの英会話コーチングツールです。ユーザーは様々なシナリオを選び、AIコー…
★ 1 ⑂ 1 MIT 2026-06-21
音楽生成
GitHub
js-ai-image-cli
ai-media-cliは、JavaScript/TypeScript環境でAI画像、動画、音楽、音声を簡単に生成するためのツールです。CLI、npx…
★ 1 MIT 2026-03-20