3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1751 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
画像生成 GitHub image-skill-cli
「Image Skill CLI」は、AIエージェント向けに画像生成・編集、動画・音声生成、3D作成をゼロセットアップで実現する…
★ 1 MIT 2026-06-25
音楽生成 GitHub code-music
「code-music」はPythonを使ってプログラムで音楽を生成するためのライブラリおよびツールセットです。単一のスケー…
★ 1 MIT 2026-05-07
マルチモーダル GitHub ragonfire
RagOnFireは、Apple Silicon Mac向けに設計された完全ローカルなマルチモーダルRAG(検索拡張生成)システムです。Ol…
★ 1 MIT 2026-05-21
動画生成 GitHub ai-video-router
ai-video-routerは、自然言語で動画の要件を記述すると、Groq Llama 4 Scoutが最適なコードベースの動画ライブラリ(…
★ 1 2026-04-20
動画生成 GitHub nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
ASR / 音声認識 GitHub Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
LLM GitHub lopi
lopiは、Claude Codeエージェントを並列実行するためのRust製オーケストレーターです。各タスクをGitで分離したブラ…
★ 1 2026-06-24
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
LLM GitHub visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
マルチモーダル GitHub qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
3D / NeRF GitHub token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
画像生成 GitHub f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06
動画生成 GitHub web
x402-video.comは、x402決済プロトコルとBase上のUSDCを利用して、AIビデオを生成できるWebストアフロントです。アカ…
★ 1 2026-06-24
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
AIエージェント GitHub 3d-cli
`3d`は、FDM(熱溶解積層法)3Dプリンティングの全ライフサイクルを網羅するスクリプト可能なCLIおよびWebツールキッ…
★ 1 2026-06-25
3D / NeRF GitHub telemetry-frame-mapper
本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…
★ 1 MIT 2026-06-26
LLM GitHub sibyl
Sibylは、TemporalとGo言語で構築された、堅牢なマルチエージェント収束フレームワークです。ResearcherとCriticの2…
★ 1 2026-05-21
ASR / 音声認識 GitHub ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
音声生成 / TTS GitHub SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18