3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1751 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
音声生成 / TTS GitHub ai-logistics-assistant
このAIロジスティクスアシスタントは、輸送および冷蔵ロジスティクスに特化したマルチモーダルAIツールです。RAG(検…
★ 1 2026-06-16
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
マルチモーダル GitHub ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
AIエージェント GitHub ninja-harness
Ninja Harnessは、AIエージェントのプロダクション環境での信頼性、安全性、効率性を評価するための、トレースを重視…
★ 1 NOASSERTION 2026-06-06
動画生成 GitHub LTX-2-Audio-to-Video-Local-XPU
このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…
★ 1 2026-03-20
3D / NeRF GitHub Gaussian-Splatting
本プロジェクトは、現実世界の画像データから3D Gaussian Splatting技術を用いてTH OWLキャンパスの建物を高精度に再…
★ 1 2026-05-27
AIエージェント GitHub Agent-Runtime-Community
Agent Runtime Security Platformは、自律型AIエージェントのためのオープンソースのゼロトラストセキュリティ、ガバ…
★ 1 2026-05-31
AIエージェント GitHub agent-conductor
Agent Conductorは、AIエージェントのスキルを、ゲート付きの監視可能なワークフローに変換するツールです。各ステッ…
★ 1 MIT 2026-06-11
音楽生成 GitHub midi-sketch
midi-sketchは、ルールベースでポップミュージックのMIDIスケッチを自動生成するC++17ライブラリです。WebAssemblyで…
★ 1 Apache-2.0 2026-06-07
音声生成 / TTS GitHub voice-send-mcp
voice-send-mcpは、AIチャットクライアント内で再生可能な短い音声メッセージ(TTSボイスバブル)を送信するためのス…
★ 1 MIT 2026-06-17
3D / NeRF GitHub sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
マルチモーダル GitHub miru
Miru(見る)は、マルチモーダルAIモデルの「ブラックボックス」問題を解決するための説明可能性エンジンです。画像…
★ 1 2026-06-22
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
マルチモーダル GitHub qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
画像生成 GitHub LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
動画生成 GitHub veo-3.1-api
本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…
★ 1 MIT 2026-06-14
AIエージェント GitHub orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
LLM GitHub local-ai-lab
「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…
★ 1 MIT 2026-06-20
画像生成 GitHub Deep-Learning-Models
本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…
★ 1 MIT 2026-06-11