3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#CLI (1751 repos)

「CLI」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

code-driven-video-template

「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…

#Azure Neural TTS #CLI #Node.js

★ 1 MIT 2026-06-14

ASR / 音声認識

GitHub

Auto-Vod-Trimmer

Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…

#AI #CLI #Python

★ 1 GPL-3.0 2026-06-26

音声生成 / TTS

GitHub

ai-logistics-assistant

このAIロジスティクスアシスタントは、輸送および冷蔵ロジスティクスに特化したマルチモーダルAIツールです。RAG（検…

#CLI #Python #RAG

★ 1 2026-06-16

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17

マルチモーダル

GitHub

clip-from-scratch

このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-12

ASR / 音声認識

GitHub

voxi

Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…

#AIアシスタント連携 (MCP) #CLI #Python

★ 1 MIT 2026-05-25

AIエージェント

GitHub

ninja-harness

Ninja Harnessは、AIエージェントのプロダクション環境での信頼性、安全性、効率性を評価するための、トレースを重視…

#CLI #Pyodide #Python

★ 1 NOASSERTION 2026-06-06

動画生成

GitHub

LTX-2-Audio-to-Video-Local-XPU

このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…

#AIモデル #CLI #GPU必須

★ 1 2026-03-20

3D / NeRF

GitHub

Gaussian-Splatting

本プロジェクトは、現実世界の画像データから3D Gaussian Splatting技術を用いてTH OWLキャンパスの建物を高精度に再…

#3D Gaussian Splatting #CLI #Docker

★ 1 2026-05-27

AIエージェント

GitHub

Agent-Runtime-Community

Agent Runtime Security Platformは、自律型AIエージェントのためのオープンソースのゼロトラストセキュリティ、ガバ…

#AIエージェント #CLI #Python

★ 1 2026-05-31

AIエージェント

GitHub

agent-conductor

Agent Conductorは、AIエージェントのスキルを、ゲート付きの監視可能なワークフローに変換するツールです。各ステッ…

#AI Agent #CLI #JSON

★ 1 MIT 2026-06-11

音楽生成

GitHub

midi-sketch

midi-sketchは、ルールベースでポップミュージックのMIDIスケッチを自動生成するC++17ライブラリです。WebAssemblyで…

#C++ #CLI #JavaScript

★ 1 Apache-2.0 2026-06-07

音声生成 / TTS

GitHub

voice-send-mcp

voice-send-mcpは、AIチャットクライアント内で再生可能な短い音声メッセージ（TTSボイスバブル）を送信するためのス…

#CLI #Docker #MCP対応

★ 1 MIT 2026-06-17

3D / NeRF

GitHub

sfm-monocular-reconstruction

このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …

#CLI #GPU必須 #Python

★ 1 MIT 2026-04-27

マルチモーダル

GitHub

miru

Miru（見る）は、マルチモーダルAIモデルの「ブラックボックス」問題を解決するための説明可能性エンジンです。画像…

#CLI #FastAPI #Python

★ 1 2026-06-22

ASR / 音声認識

GitHub

whisper-dictate

Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…

#CLI #Gemini API #Groq API

★ 1 NOASSERTION 2026-06-10

マルチモーダル

GitHub

qwen-visual-training-lab

「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…

#AMD GPU #CLI #DirectML

★ 1 2026-05-15

画像生成

GitHub

LoRA-Dataset-Coach

「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…

#CLI #GPU推奨 #GUI (Tkinter)

★ 1 NOASSERTION 2026-06-05

動画生成

GitHub

veo-3.1-api

本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…

#AI #API #CLI

★ 1 MIT 2026-06-14

AIエージェント

GitHub

orchestrate-skill

「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者（脳）とし…

#AI / LLM #Claude Code #CLI

★ 1 MIT 2026-06-13

音楽生成

GitHub

musical-doodle

「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…

#CLI #Music/Audio Generation #Productivity Tool

★ 1 2026-04-07

LLM

GitHub

local-ai-lab

「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…

#C# #CLI #Node.js

★ 1 MIT 2026-06-20

画像生成

GitHub

Deep-Learning-Models

本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…

#CLI #Jupyter Notebook #Python

★ 1 MIT 2026-06-11