3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
nvatar-demo
NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…
★ 2 MIT 2026-06-02
ASR / 音声認識
GitHub
AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
LLM
GitHub
AI-consultant-for-the-store
このプロジェクトは、自然言語を理解し、カタログからの商品推奨、カート管理、注文処理、およびマネージャーへの通…
★ 2 MIT 2026-06-22
動画生成
GitHub
auto-tiktok
Auto TikTokは、Douyin/TikTokクリエイター向けのローカルファーストなAI短編動画自動生成ツールです。与えられたト…
★ 2 MIT 2026-05-21
音楽生成
GitHub
moltdj-skill
moltdjは、AIエージェント専用に設計されたAPIファーストの音楽・ポッドキャストプラットフォームです。AIエージェン…
★ 2 MIT 2026-04-28
音声生成 / TTS
GitHub
Supertonic-Voice
Supertonic Voiceは、PySide6とローカルONNX AI音声モデルで構築された、オフラインのデスクトップ音声合成(TTS)ア…
★ 2 MIT 2026-06-16
AIエージェント
GitHub
neon-shadows
「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…
★ 2 2026-05-18
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
ASR / 音声認識
GitHub
Murmur
Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…
★ 2 ⑂ 2 NOASSERTION 2026-06-22
LLM
GitHub
AGENT33-PUBLIC
AGENT-33は、ローカルファーストのマルチエージェントオーケストレーションプラットフォームです。複数のAIエージェ…
★ 2 Apache-2.0 2026-05-28
マルチモーダル
GitHub
Viz2Speech
Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…
★ 2 ⑂ 1 MIT 2026-05-16
音楽生成
GitHub
ai-music-studio
ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…
★ 2 NOASSERTION 2026-04-26
音声生成 / TTS
GitHub
voice-ai-chat
このツールは、オープンソース技術(Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど)を基にゼロから構築された音声AI…
★ 2 MIT 2026-05-25
画像生成
GitHub
models-info
このツールは、Stable Diffusion WebUI用の拡張機能「Models Info」です。Stable DiffusionのチェックポイントやLoRA…
★ 2 MIT 2026-05-28
LLM
GitHub
AI-Procurement-Intelligence-System
「AI Procurement Intelligence System」は、企業向けに設計されたAI駆動型のマルチエージェント調達インテリジェン…
★ 2 MIT 2026-06-16
3D / NeRF
GitHub
prml-vslam
このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…
★ 2 MIT 2026-06-26
ComfyUI
GitHub
ComfyUI_PromptExtractor_nodes
ComfyUI向けのカスタムノード集で、ComfyUIが生成したPNG画像のメタデータからプロンプトを抽出できます。元のワーク…
★ 2 ⑂ 1 MIT 2026-04-07
音声生成 / TTS
GitHub
say-lab
Say Labは、大規模言語モデルとクラウドTTS(Text-to-Speech)を活用した軽量な自ホスト型発音練習Webページです。単…
★ 2 2026-05-14
ComfyUI
GitHub
LoRA-Gallery-Loader—Custom-Node
「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA(Low-R…
★ 2 ⑂ 1 2026-04-18
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 2 ⑂ 1 MIT 2026-04-17
画像生成
GitHub
ChatGPTtoImage-SelfHost
「ChatGPTtoImage-SelfHost」は、DinhLucentによって開発された、ChatGPTの画像生成機能をセルフホストで利用するた…
★ 2 MIT 2026-04-26
ASR / 音声認識
GitHub
rust-whisper-diarization
rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。whisper.c…
★ 2 2026-05-23
音声生成 / TTS
GitHub
voice-channel
このツールは「voice-channel」と名付けられ、Claude Codeエージェントをハンズフリーで音声操作するためのローカル…
★ 2 NOASSERTION 2026-06-23