3,636 repos GH 3,521 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
音楽生成 GitHub MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
マルチモーダル GitHub xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
ComfyUI GitHub ComfyUI-Foundation-1
ComfyUI-Foundation-1は、ComfyUIにFoundation-1カスタムノードを追加し、テキストプロンプトから短時間の音楽サンプ…
★ 1 ⑂ 1 NOASSERTION 2026-06-29
LLM GitHub ChatPDF
このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG(検索拡張生成)ベースのPDFチャットアプリケーション…
★ 1 MIT 2026-05-20
LLM GitHub visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
音声生成 / TTS GitHub RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ComfyUI GitHub vfx-familiar
VFX Familiarは、ComfyUIを大規模なVFXプロダクションで利用する際の課題(アセット管理の複雑化、再現性の困難さ)…
★ 1 MIT 2026-04-30
音声生成 / TTS GitHub openclaw-fish-audio
Conan-Scott/openclaw-fish-audioは、OpenClaw向けのFish Audio TTS音声プロバイダプラグインです。高品質な音声クロ…
★ 1 ⑂ 1 MIT 2026-05-15
音声生成 / TTS GitHub hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
マルチモーダル GitHub agents-connector
agents-connectorは、Claude Code、Codex、Gemini CLIといったAIエージェント間の連携を可能にするローカルメッセー…
★ 1 MIT 2026-06-23
ASR / 音声認識 GitHub stenographer
「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…
★ 1 2026-06-08
AIエージェント GitHub agentmd
AgentMDは、Claude Codeエージェントの監査、整理、安全なルーティングを支援するCLIおよびMCP(Claude Code)ベース…
★ 1 MIT 2026-05-31
ComfyUI GitHub comfyui-touch-numeric
「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット(seedやINT/FLOAT値など)を、…
★ 1 ⑂ 1 MIT 2026-06-24
音楽生成 GitHub Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
画像生成 GitHub diffusion-boltzmann-sampler
拡散ボルツマンサンプラーは、スコアベースの拡散モデルを用いてボルツマン分布からのサンプリングを加速する、統計…
★ 1 2026-06-25
AIエージェント GitHub OhMyAgent
OhMyAgentは、永続的な記憶システムを持つ自己ホスト型AIエージェントゲートウェイであり、セッション間で情報を忘れ…
★ 1 MIT 2026-06-26
動画生成 GitHub seedance-2-api
Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…
★ 1 MIT 2026-05-25
マルチモーダル GitHub mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
マルチモーダル GitHub loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
ComfyUI GitHub ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18