3,636 repos GH 3,521 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル

GitHub

corpus-mill

「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画（人物…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-06

音楽生成

GitHub

MAZ-MUSIC

MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…

#AI生成 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-15

マルチモーダル

GitHub

xhs-note-reader

このツールは、中国のソーシャルメディア「小紅書」の図文ノート（画像とテキスト投稿）を、タイトル、本文、全画像…

#Claude Code対応 #CLI #Linux対応

★ 1 MIT 2026-05-19

ComfyUI

GitHub

ComfyUI-Foundation-1

ComfyUI-Foundation-1は、ComfyUIにFoundation-1カスタムノードを追加し、テキストプロンプトから短時間の音楽サンプ…

#ComfyUI対応 #GPU必須 #Windows

★ 1 ⑂ 1 NOASSERTION 2026-06-29

LLM

GitHub

ChatPDF

このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG（検索拡張生成）ベースのPDFチャットアプリケーション…

#Python #RAG #Web UI

★ 1 MIT 2026-05-20

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

音声生成 / TTS

GitHub

RustyClaw

RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…

#CLI #LLM #RAG

★ 1 Apache-2.0 2026-05-08

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

ComfyUI

GitHub

vfx-familiar

VFX Familiarは、ComfyUIを大規模なVFXプロダクションで利用する際の課題（アセット管理の複雑化、再現性の困難さ）…

#ComfyUI Cloud対応 #MCP SDK #Node.js

★ 1 MIT 2026-04-30

音声生成 / TTS

GitHub

openclaw-fish-audio

Conan-Scott/openclaw-fish-audioは、OpenClaw向けのFish Audio TTS音声プロバイダプラグインです。高品質な音声クロ…

#API連携 #OpenClaw対応 #Python

★ 1 ⑂ 1 MIT 2026-05-15

音声生成 / TTS

GitHub

hermes-weixin-voice

hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…

#CLI #Python #WeChat連携

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

agents-connector

agents-connectorは、Claude Code、Codex、Gemini CLIといったAIエージェント間の連携を可能にするローカルメッセー…

#Claude対応 #CLI #Codex対応

★ 1 MIT 2026-06-23

ASR / 音声認識

GitHub

stenographer

「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…

#CLI #macOS #Zig

★ 1 2026-06-08

AIエージェント

GitHub

agentmd

AgentMDは、Claude Codeエージェントの監査、整理、安全なルーティングを支援するCLIおよびMCP（Claude Code）ベース…

#Claude Code対応 (MCP) #CLI #GitHub連携

★ 1 MIT 2026-05-31

ComfyUI

GitHub

comfyui-touch-numeric

「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット（seedやINT/FLOAT値など）を、…

#ComfyUI対応 #Python #Vue.js

★ 1 ⑂ 1 MIT 2026-06-24

音楽生成

GitHub

Melodic-Intelligence-Layer

MIL（Melodic Intelligence Layer）は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…

#API #CLI #MIDI出力

★ 1 Apache-2.0 2026-04-05

画像生成

GitHub

diffusion-boltzmann-sampler

拡散ボルツマンサンプラーは、スコアベースの拡散モデルを用いてボルツマン分布からのサンプリングを加速する、統計…

#Linux対応 #Windows対応 #スタンドアロンアプリケーション

★ 1 2026-06-25

AIエージェント

GitHub

OhMyAgent

OhMyAgentは、永続的な記憶システムを持つ自己ホスト型AIエージェントゲートウェイであり、セッション間で情報を忘れ…

#CLI #Linux #macOS

★ 1 MIT 2026-06-26

動画生成

GitHub

seedance-2-api

Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…

#API #CLI #Node.js

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

mm-docqa

Jmiao11/mm-docqaは、図とテキストが混在するPDF（特に論文の図表を含む）の内容に対して質問し、引用元付きの回答を…

#CLI #GPU推奨 #Python

★ 1 MIT 2026-06-23

マルチモーダル

GitHub

loop-antigravity

loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…

#CLI #GCP #Gemini API

★ 1 Apache-2.0 2026-06-14

ASR / 音声認識

GitHub

Auto-Vod-Trimmer

Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…

#AI #CLI #Python

★ 1 GPL-3.0 2026-06-26

ComfyUI

GitHub

ComfyUI-Selective-Sigma-Detailer

ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…

#AI/機械学習 #ComfyUIカスタムノード #GPU必須

★ 1 ⑂ 3 MIT 2026-05-10

ASR / 音声認識

GitHub

VoiceOfIU

VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…

#APIキー不要 #Apple Silicon対応 #macOS

★ 1 Apache-2.0 2026-06-18