3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

AIエージェント

GitHub

coder-crew

coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…

#CLI #Ollama #Python

★ 1 MIT 2026-06-18

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

ComfyUI

GitHub

Comfy_Storyboard

「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…

#ComfyUI対応 #Python #Web UI

★ 1 MIT 2026-04-13

LLM

GitHub

rag-agent

このツールは、本番環境に対応したRAG（検索拡張生成）とAIエージェントプラットフォームです。高密度、BM25、RRFを…

#CLI #Docker #FastAPI

★ 1 2026-05-26

音楽生成

GitHub

reelsmith

AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…

#AI #CLI #FFmpeg

★ 1 Apache-2.0 2026-06-16

ASR / 音声認識

GitHub

VoiceAgentAI

このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識（STT）と音声合成（TTS）をシー…

#CLI #OpenAI API連携 #Python

★ 1 MIT 2026-05-25

ASR / 音声認識

GitHub

language-violence-intervention-system

本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …

#Python #Raspberry Pi対応 #Web UI

★ 1 ⑂ 1 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

Multimodal-Emotion-Recognition-System

このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…

#CLI #Machine Learning #Python

★ 1 2026-06-08

音声生成 / TTS

GitHub

ha-car-spoken-alerts

このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…

#Android Auto #CLI #Home Assistant

★ 1 MIT 2026-06-13

ASR / 音声認識

GitHub

diting-ai-bilibili-video-to-text-notes

本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…

#AI利用 #API利用 #Bilibili対応

★ 1 ⑂ 1 MIT 2026-06-26

LLM

GitHub

pdf-analyzer

このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG（検索拡張生成）システムです。PDFをアップロードす…

#PDF分析 #Python #RAGシステム

★ 1 2026-05-14

音声生成 / TTS

GitHub

nemoflix-studio

Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…

#API-first #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-16

ASR / 音声認識

GitHub

mixpeek-extractors

Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…

#API #CLI #Multimodal

★ 1 MIT 2026-06-16

LLM

GitHub

awesome-llm-training-inference

このリポジリポジトリは、大規模言語モデル（LLM）のトレーニングと推論に関する優れたフレームワーク、ツール、リソ…

#LLM #Python #トレーニング

★ 1 ⑂ 1 NOASSERTION 2026-03-06

マルチモーダル

GitHub

zero-shot-video-classifier

このツールは、ビジョン言語基盤モデル（CLIP、SigLIP 2、X-CLIP）を用いたゼロショット動画分類器です。タスク固有…

#Docker #HuggingFace Transformers #Python

★ 1 2026-06-09

画像生成

GitHub

ComfyUI_SparkVSR_SM

ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-07-01

ASR / 音声認識

GitHub

AI-VERSE

「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…

#HuggingFace Transformers #NLP #Python

★ 1 2026-05-21

音声生成 / TTS

GitHub

ai-dubbing-studio

AI Dubbing Studioは、オーディオ/ビデオファイルをAIが希望の言語でダビングしてくれるウェブサービスです。ElevenL…

#AI #ElevenLabs連携 #Next.js

★ 1 MIT 2026-06-23

ComfyUI

GitHub

comfyui-vsco-scraper

このcomfyui-vsco-scraperは、ComfyUI用のカスタムノードパックで、公開されているVSCOプロフィールから画像をスクレ…

#Chrome必須 #ComfyUI対応 #Playwright

★ 1 ⑂ 1 MIT 2026-03-29

マルチモーダル

GitHub

qwen-visual-training-lab

「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…

#AMD GPU #CLI #DirectML

★ 1 2026-05-15

画像生成

GitHub

sd-webui-forge-multi-prompt-slots

SD WebUI Forge向けのこの拡張機能は、最大30個のプロンプトスロットを管理し、一括で画像生成や設定保存を可能にし…

#SD WebUI Forge対応 #Web UI #カスタムUI

★ 1 MIT 2026-06-24

画像生成

GitHub

prompt-caching

prompt-cachingは、AnthropicのClaude Code利用時にプロンプトを自動的にキャッシュ・再利用することで、トークン使…

#Claude Code対応 #Windows対応 #セットアップ不要

★ 1 MIT 2026-06-25

3D / NeRF

GitHub

NeRF.cpp

NeRF.cppは、C++とLibTorchを用いてNeRF（Neural Radiance Fields）を実装したツールです。静止したシーンのRGB画像…

#3D再構成 #C++ #CLI

★ 1 BSD-3-Clause 2026-05-17

AIエージェント

GitHub

agentos

AgentOSは、複数のAIエージェントが記憶を共有し、連携してタスクを遂行するための基盤となる「AIエージェント向けオ…

#CLI #FastAPI #Gemini API

★ 1 2026-06-15