3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ComfyUI
GitHub
comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
マルチモーダル
GitHub
thesis-iot-monitoring
このツールは、自然言語の指示に基づいてIoTデバイスが自律的に視覚監視を行うシステムです。AIエージェントがユーザ…
★ 5 ⑂ 1 NOASSERTION 2026-06-05
動画生成
GitHub
claude-video-editor
Claude video editorは、AIアシスタントのClaudeを活用し、コマンドラインで動画編集や動画生成を行うツールです。フ…
★ 5 ⑂ 1 NOASSERTION 2026-06-12
動画生成
GitHub
veo-api
Veo 3 APIは、Googleの最新AI動画生成モデルであるGoogle Veo 3(Veo3, Veo 3.1, Veo 3 Fast)へ、最も安価で容易に…
★ 5 MIT 2026-05-27
画像生成
GitHub
bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
LLM
GitHub
mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02
音声生成 / TTS
GitHub
openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
LLM
GitHub
spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
LLM
GitHub
SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
音声生成 / TTS
GitHub
voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-06-24
AIエージェント
GitHub
thesis-cli
Thesisは、AIがウォーレン・バフェットとベンジャミン・グレアムのバリュー投資戦略に基づき、公開企業の投資リサー…
★ 5 MIT 2026-05-29
画像生成
GitHub
codex-studio
Codex Studioは、ローカル環境での画像生成と編集に特化したオープンソースのワークスペースです。認証済みのCodex/C…
★ 5 MIT 2026-06-25
LLM
GitHub
docker-docling
このツールは、IBM Doclingを基盤としたセルフホスト型のドキュメント解析サーバーをDockerで簡単にデプロイするため…
★ 5 NOASSERTION 2026-06-21
ASR / 音声認識
GitHub
Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI
GitHub
comfyui-image-tiled-nodes
「ComfyUI Image Tiled Nodes」は、ComfyUI用のカスタムノードセットです。このツールは、大規模な画像を重複するタ…
★ 5 ⑂ 1 MIT 2026-06-10
音声生成 / TTS
GitHub
arli
ARLIは、Rustで開発された、多機能かつプロダクショングレードのAIエージェントハーネスです。ランタイム依存を持た…
★ 5 MIT 2026-06-15
AIエージェント
GitHub
Hermes-Memory-OS
Hermes Memory-OSは、長時間稼働するHermesエージェント向けの「ファイルファースト」なメモリおよびガバナンスラン…
★ 5 MIT 2026-06-25
音声生成 / TTS
GitHub
voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-06-23
LLM
GitHub
SeqStudio
SeqStudioは、タンパク質の機能アノテーションを行うための生成型推論システムです。配列相同性、構造類似性、ドメイ…
★ 4 MIT 2026-04-21
音声生成 / TTS
GitHub
CosyVoiceUI
CosyVoiceUIは、NVIDIA Triton Inference ServerとFastAPIを基盤とした高性能なCosyVoiceテキスト読み上げ(TTS)管…
★ 4 2026-06-10
ASR / 音声認識
GitHub
DialoStack
DialoStackは、ROS 2ロボットが目標指向の音声会話を行えるようにするフレームワークです。ユーザーから構造化データ…
★ 4 MIT 2026-06-04