3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
AIエージェント GitHub coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
ASR / 音声認識 GitHub Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
ComfyUI GitHub Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
LLM GitHub rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
音楽生成 GitHub reelsmith
AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25
ASR / 音声認識 GitHub Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
音声生成 / TTS GitHub ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
ASR / 音声認識 GitHub diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 ⑂ 1 MIT 2026-06-26
LLM GitHub pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
音声生成 / TTS GitHub nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
LLM GitHub awesome-llm-training-inference
このリポジリポジトリは、大規模言語モデル(LLM)のトレーニングと推論に関する優れたフレームワーク、ツール、リソ…
★ 1 ⑂ 1 NOASSERTION 2026-03-06
マルチモーダル GitHub zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
画像生成 GitHub ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
ASR / 音声認識 GitHub AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
音声生成 / TTS GitHub ai-dubbing-studio
AI Dubbing Studioは、オーディオ/ビデオファイルをAIが希望の言語でダビングしてくれるウェブサービスです。ElevenL…
★ 1 MIT 2026-06-23
ComfyUI GitHub comfyui-vsco-scraper
このcomfyui-vsco-scraperは、ComfyUI用のカスタムノードパックで、公開されているVSCOプロフィールから画像をスクレ…
★ 1 ⑂ 1 MIT 2026-03-29
マルチモーダル GitHub qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
画像生成 GitHub sd-webui-forge-multi-prompt-slots
SD WebUI Forge向けのこの拡張機能は、最大30個のプロンプトスロットを管理し、一括で画像生成や設定保存を可能にし…
★ 1 MIT 2026-06-24
画像生成 GitHub prompt-caching
prompt-cachingは、AnthropicのClaude Code利用時にプロンプトを自動的にキャッシュ・再利用することで、トークン使…
★ 1 MIT 2026-06-25
3D / NeRF GitHub NeRF.cpp
NeRF.cppは、C++とLibTorchを用いてNeRF(Neural Radiance Fields)を実装したツールです。静止したシーンのRGB画像…
★ 1 BSD-3-Clause 2026-05-17
AIエージェント GitHub agentos
AgentOSは、複数のAIエージェントが記憶を共有し、連携してタスクを遂行するための基盤となる「AIエージェント向けオ…
★ 1 2026-06-15