3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
ASR / 音声認識
GitHub
AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
ComfyUI
GitHub
L2MAS
L2MASは、Live2Dアニメーション制作を多エージェントAIで自動化するためのプロトタイプです。MCPおよびA2Aプロトコル…
★ 1 Apache-2.0 2026-06-27
音声生成 / TTS
GitHub
Cartesia
Cartesiaは、tryAGIが提供する低遅延のText-to-Speech (TTS)、Speech-to-Text (STT)、音声クローニング、AIエージェ…
★ 1 MIT 2026-06-30
マルチモーダル
GitHub
vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
AIエージェント
GitHub
agent-pods
Agent Podsは、AIエージェントをルートレスPodmanポッドで管理するための、プライベートかつGit管理されたコントロー…
★ 1 MIT 2026-05-31
ASR / 音声認識
GitHub
ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM
GitHub
rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-07-04
3D / NeRF
GitHub
faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
ASR / 音声認識
GitHub
claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
LLM
GitHub
Repo-Sage
RepoSageは、開発者やエンジニアリングチーム向けの100%オフラインのAgentic GraphRAGシステムです。GitHubリポジト…
★ 1 2026-06-15
音声生成 / TTS
GitHub
ai-logistics-assistant
このAIロジスティクスアシスタントは、輸送および冷蔵ロジスティクスに特化したマルチモーダルAIツールです。RAG(検…
★ 1 2026-06-16
画像生成
GitHub
gpt-image-2-openai
「GPT Image 2 – OpenAI Image Generator」は、OpenAIのDALL-E技術を搭載した無料のAI画像生成ツールです。テキスト…
★ 1 NOASSERTION 2026-05-07
動画生成
GitHub
awesome-ai-media
JuneYaooo/awesome-ai-mediaは、AIを活用した動画作成、ソーシャルメディア自動化、コンテンツ作成ツールを150以上厳…
★ 1 ⑂ 3 2026-06-23
動画生成
GitHub
ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-07-01
画像生成
GitHub
ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
LLM
GitHub
langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
AIエージェント
GitHub
traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成
GitHub
seedance-ip-pipeline
「Seedance IP Pipeline」は、Higgsfield Seedance 2.0とストーリーボード参照ワークフローに基づいた、AIビデオ生成…
★ 1 MIT 2026-05-09
音声生成 / TTS
GitHub
vox
「Vox」は、macOS専用のメニューバー常駐型音声入力アプリです。Optionキーを押しながら話すだけで、多言語対応の高…
★ 1 AGPL-3.0 2026-07-03
LLM
GitHub
docintel
DocIntelは、RAG(検索拡張生成)技術を用いたAIドキュメントインテリジェンスシステムです。PDF、DOCX、TXT、Markdo…
★ 1 2026-06-23
画像生成
GitHub
grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
画像生成
GitHub
Text-conversion-to-handwritten-pictures
このツールは、テキストを手書き風の画像に変換するGUIアプリケーションです。複数のフォントやページ選択オプション…
★ 1 2026-06-09
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30