3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
HiggsAudiov2TokenizerUnofficial
本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。960倍ダウン…
★ 6 ⑂ 2 2025-10-08
画像生成
GitHub
spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
ASR / 音声認識
GitHub
game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-11
ComfyUI
GitHub
comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
3D / NeRF
GitHub
mutual-info-optimization
このリポジトリは、実際の画像とテクスチャ付き3Dメッシュ間の相互情報量(Mutual Information)を利用して、6自由度…
★ 6 2026-03-20
画像生成
GitHub
best-ai-image-generator-resources
AI画像生成に関する最適なリソース、モデル比較フレームワーク、プロンプトガイド、編集ワークフロー、およびClipris…
★ 6 2026-04-28
AIエージェント
GitHub
commerce-agents
commerce-agentsは、Eコマースアプリケーション向けに自律型エージェントを構築するためのツール群です。在庫管理、…
★ 6 MIT 2026-05-01
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS
GitHub
kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
3D / NeRF
GitHub
higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
動画生成
GitHub
Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 6 ⑂ 2 CC0-1.0 2026-06-15
3D / NeRF
GitHub
generative-ai-start-to-surrender
このGitHubリポジトリは、「Generative AI: From Start to Surrender – A Practical Guide to Mastering and Struggl…
★ 6 ⑂ 1 NOASSERTION 2025-10-08
音声生成 / TTS
GitHub
arietta-voice
Arietta Voiceは、Apple Silicon Mac向けに設計された、ローカルファーストのカスタマイズ可能なAI音声アシスタント…
★ 5 Apache-2.0 2026-04-28
LLM
GitHub
agentic-workspace-core
このツールは、Daaaaave/agentic-workspace-coreという、コーディングエージェントのためのポータブルなワークスペー…
★ 5 MIT 2026-06-11
LLM
GitHub
OpenMetaMate
MetaMateは、LLM(大規模言語モデル)を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…
★ 5 NOASSERTION 2026-06-20
LLM
GitHub
Customer-Support-Chatbot-102
このツールは、RAG(Retrieval-Augmented Generation)、高度なプロンプトエンジニアリング、ハイブリッド検索、リラ…
★ 5 MIT 2026-06-04
マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 5 AGPL-3.0 2026-05-20
動画生成
GitHub
wan2gp-operator
Wan2GP Operatorは、WanGP/Wan2GPによるテキストからビデオ生成を効率化・自動化するオープンソースのCLIツールです…
★ 5 MIT 2026-05-11
3D / NeRF
GitHub
Kestrel
Kestrelは、ロボティクスおよびシミュレーションパイプライン向けのリアルタイム2D Gaussian Splattingビューアです…
★ 5 2026-06-05
3D / NeRF
GitHub
wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
ComfyUI
GitHub
ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
音声生成 / TTS
GitHub
qwen3-tts-spanish-voices
このツールは、Qwen3-TTSを利用してスペイン語のテキスト読み上げ(TTS)機能を提供します。Apple Silicon搭載のMac…
★ 5 ⑂ 2 MIT 2026-06-21
画像生成
GitHub
drawthings-grpc-hermes-plugin
このツールは、Hermes AgentがDraw Thingsのローカル画像生成機能を利用できるようにするgRPCプラグインです。Draw T…
★ 5 ⑂ 1 MIT 2026-06-02