3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ComfyUI GitHub comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
マルチモーダル GitHub thesis-iot-monitoring
このツールは、自然言語の指示に基づいてIoTデバイスが自律的に視覚監視を行うシステムです。AIエージェントがユーザ…
★ 5 ⑂ 1 NOASSERTION 2026-06-05
動画生成 GitHub claude-video-editor
Claude video editorは、AIアシスタントのClaudeを活用し、コマンドラインで動画編集や動画生成を行うツールです。フ…
★ 5 ⑂ 1 NOASSERTION 2026-06-12
動画生成 GitHub veo-api
Veo 3 APIは、Googleの最新AI動画生成モデルであるGoogle Veo 3(Veo3, Veo 3.1, Veo 3 Fast)へ、最も安価で容易に…
★ 5 MIT 2026-05-27
画像生成 GitHub bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
LLM GitHub mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
AIエージェント GitHub ai-security-methodology
AI Security Methodologyは、AIエージェント向けのセキュリティ研究方法論を提供するリポジトリです。攻撃パターン、…
★ 5 MIT 2026-05-23
LLM GitHub SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
音声生成 / TTS GitHub voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-06-24
AIエージェント GitHub thesis-cli
Thesisは、AIがウォーレン・バフェットとベンジャミン・グレアムのバリュー投資戦略に基づき、公開企業の投資リサー…
★ 5 MIT 2026-05-29
画像生成 GitHub codex-studio
Codex Studioは、ローカル環境での画像生成と編集に特化したオープンソースのワークスペースです。認証済みのCodex/C…
★ 5 MIT 2026-06-25
LLM GitHub docker-docling
このツールは、IBM Doclingを基盤としたセルフホスト型のドキュメント解析サーバーをDockerで簡単にデプロイするため…
★ 5 NOASSERTION 2026-06-21
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI GitHub comfyui-image-tiled-nodes
「ComfyUI Image Tiled Nodes」は、ComfyUI用のカスタムノードセットです。このツールは、大規模な画像を重複するタ…
★ 5 ⑂ 1 MIT 2026-06-10
音声生成 / TTS GitHub arli
ARLIは、Rustで開発された、多機能かつプロダクショングレードのAIエージェントハーネスです。ランタイム依存を持た…
★ 5 MIT 2026-06-15
AIエージェント GitHub Hermes-Memory-OS
Hermes Memory-OSは、長時間稼働するHermesエージェント向けの「ファイルファースト」なメモリおよびガバナンスラン…
★ 5 MIT 2026-06-25
音声生成 / TTS GitHub voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-06-23
LLM GitHub SeqStudio
SeqStudioは、タンパク質の機能アノテーションを行うための生成型推論システムです。配列相同性、構造類似性、ドメイ…
★ 4 MIT 2026-04-21
音声生成 / TTS GitHub narrator.wyoming
日本語の要約(200〜400文字、何ができるツールか・特徴・想定ユーザーを含める)
★ 4 MIT 2026-06-23
音声生成 / TTS GitHub CosyVoiceUI
CosyVoiceUIは、NVIDIA Triton Inference ServerとFastAPIを基盤とした高性能なCosyVoiceテキスト読み上げ(TTS)管…
★ 4 2026-06-10
ASR / 音声認識 GitHub DialoStack
DialoStackは、ROS 2ロボットが目標指向の音声会話を行えるようにするフレームワークです。ユーザーから構造化データ…
★ 4 MIT 2026-06-04