3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
ASR / 音声認識 GitHub AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
ComfyUI GitHub L2MAS
L2MASは、Live2Dアニメーション制作を多エージェントAIで自動化するためのプロトタイプです。MCPおよびA2Aプロトコル…
★ 1 Apache-2.0 2026-06-27
音声生成 / TTS GitHub Cartesia
Cartesiaは、tryAGIが提供する低遅延のText-to-Speech (TTS)、Speech-to-Text (STT)、音声クローニング、AIエージェ…
★ 1 MIT 2026-06-30
マルチモーダル GitHub vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
AIエージェント GitHub agent-pods
Agent Podsは、AIエージェントをルートレスPodmanポッドで管理するための、プライベートかつGit管理されたコントロー…
★ 1 MIT 2026-05-31
ASR / 音声認識 GitHub ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM GitHub rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-07-04
3D / NeRF GitHub faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
ASR / 音声認識 GitHub claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
LLM GitHub Repo-Sage
RepoSageは、開発者やエンジニアリングチーム向けの100%オフラインのAgentic GraphRAGシステムです。GitHubリポジト…
★ 1 2026-06-15
音声生成 / TTS GitHub ai-logistics-assistant
このAIロジスティクスアシスタントは、輸送および冷蔵ロジスティクスに特化したマルチモーダルAIツールです。RAG(検…
★ 1 2026-06-16
画像生成 GitHub gpt-image-2-openai
「GPT Image 2 – OpenAI Image Generator」は、OpenAIのDALL-E技術を搭載した無料のAI画像生成ツールです。テキスト…
★ 1 NOASSERTION 2026-05-07
動画生成 GitHub awesome-ai-media
JuneYaooo/awesome-ai-mediaは、AIを活用した動画作成、ソーシャルメディア自動化、コンテンツ作成ツールを150以上厳…
★ 1 ⑂ 3 2026-06-23
動画生成 GitHub ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-07-01
画像生成 GitHub ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
LLM GitHub langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成 GitHub seedance-ip-pipeline
「Seedance IP Pipeline」は、Higgsfield Seedance 2.0とストーリーボード参照ワークフローに基づいた、AIビデオ生成…
★ 1 MIT 2026-05-09
音声生成 / TTS GitHub vox
「Vox」は、macOS専用のメニューバー常駐型音声入力アプリです。Optionキーを押しながら話すだけで、多言語対応の高…
★ 1 AGPL-3.0 2026-07-03
LLM GitHub docintel
DocIntelは、RAG(検索拡張生成)技術を用いたAIドキュメントインテリジェンスシステムです。PDF、DOCX、TXT、Markdo…
★ 1 2026-06-23
画像生成 GitHub grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
画像生成 GitHub Text-conversion-to-handwritten-pictures
このツールは、テキストを手書き風の画像に変換するGUIアプリケーションです。複数のフォントやページ選択オプション…
★ 1 2026-06-09
マルチモーダル GitHub DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30