3,626 repos GH 3,511 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
ASR / 音声認識 GitHub claudegram
claudegramは、AI(Claude Code)を活用して個人のTelegramアカウントを高度に制御・自動化できるデスクトップアプリ…
★ 1 MIT 2026-06-29
ComfyUI GitHub comfyui-runpod-agentic-nodes
ComfyUI Agentic workflow nodes (CRAG nodes)は、ComfyUI内でRunpod上のエージェントシステムを視覚的に設計、計画…
★ 1 MIT 2026-05-29
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ASR / 音声認識 GitHub aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識 GitHub jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ComfyUI GitHub ComfyUI-KittenTTS
ComfyUI向けのカスタムノード「KittenTTS」を追加し、入力したテキストを選択した音声モデルで読み上げ音声へ変換で…
★ 1 ⑂ 1 Apache-2.0 2025-08-09
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
3D / NeRF GitHub perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
音楽生成 GitHub SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 1 ⑂ 1 MIT 2026-06-26
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub AssistPlus
AssistPlusは、視覚、聴覚、発話に障害を持つユーザー、および一般的なアクセシビリティサポートを必要とするユーザ…
★ 1 2026-05-17
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
ComfyUI GitHub ymstudio-ai-creator-os
YMSTUDIO AI Creator OSは、AI動画・コンテンツプロジェクトの企画をサポートするローカルファーストのクリエイター…
★ 1 MIT 2026-05-20
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
マルチモーダル GitHub PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
動画生成 GitHub LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
動画生成 GitHub seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
音声生成 / TTS GitHub ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
AIエージェント GitHub the-agents-of-nations
「The Agents of Nations」は、自律AIエージェントがタスクを発見し、スキーマに従ってペイロードを準備し、安全に動…
★ 1 2026-06-12
音声生成 / TTS GitHub MeteorVoice
MeteorVoiceは、AIを活用した音声ファーストの英会話コーチングツールです。ユーザーは様々なシナリオを選び、AIコー…
★ 1 ⑂ 1 MIT 2026-06-21
音楽生成 GitHub js-ai-image-cli
ai-media-cliは、JavaScript/TypeScript環境でAI画像、動画、音楽、音声を簡単に生成するためのツールです。CLI、npx…
★ 1 MIT 2026-03-20
音声生成 / TTS GitHub voice-input-dist
voice-input-distは、Windows PC向けのリアルタイム音声テキスト変換アプリです。ホットキー一つで音声入力を開始・…
★ 1 2026-06-25