3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
omnivoice-gfx1150
このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU(gfx1150/Strix Point)上で動作…
★ 1 MIT 2026-05-30
画像生成
GitHub
LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
ASR / 音声認識
GitHub
slavex
「slaveX」は、3Dアパートにいるヒューマノイドに、音声やテキストで命令して自由に動かすことができるブラウザゲー…
★ 1 MIT 2026-06-11
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
LLM
GitHub
pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
LLM
GitHub
awesome-llm-training-inference
このリポジリポジトリは、大規模言語モデル(LLM)のトレーニングと推論に関する優れたフレームワーク、ツール、リソ…
★ 1 ⑂ 1 NOASSERTION 2026-03-06
マルチモーダル
GitHub
zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
画像生成
GitHub
ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
音楽生成
GitHub
story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23
LLM
GitHub
Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
ASR / 音声認識
GitHub
aria-ai
Ariaは6〜17歳の子ども向けに設計されたデスクトップAIコンパニオンアプリです。ローカルで動作し、データプライバシ…
★ 1 ⑂ 1 AGPL-3.0 2026-05-27
ASR / 音声認識
GitHub
jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
音声生成 / TTS
GitHub
logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
ComfyUI
GitHub
ComfyUI-Orakul-SVP
ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…
★ 1 MIT 2026-06-20
動画生成
GitHub
ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
動画生成
GitHub
nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
画像生成
GitHub
Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…
★ 1 MIT 2026-05-13
LLM
GitHub
Multi-Agent-Data-Analytics
本プロジェクトは、マルチエージェントアーキテクチャとRAG(検索拡張生成)システム、GoogleのGeminiモデルを組み合…
★ 1 Apache-2.0 2026-05-15
音楽生成
GitHub
SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 1 ⑂ 1 MIT 2026-06-26
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
画像生成
GitHub
AI-FASHION-SHOPPING-ASSISTANT-CHATBOT
このツールは、Stable Diffusion v1.5 を活用したAIファッションショッピングアシスタントチャットボットです。ユー…
★ 1 2026-05-17
音声生成 / TTS
GitHub
NeuralSoundForge
NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…
★ 1 2026-02-06
LLM
GitHub
caloogy_code
Caloogy Codeは、caloogy.comのチャート作成およびAIコードエディター機能をローカルで利用できる仮想通貨定量分析ツ…
★ 1 MIT 2026-05-22