3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#CLI (1751 repos)

「CLI」タグが付いたリポジトリ

← 全リポジトリ

音楽生成
GitHub
kithairon
Kithaironは、モノフォニックなメロディから演奏可能で説明可能なカノンのバリアントを生成するシンボリック音楽コン…
★ 1 Apache-2.0 2026-05-21
マルチモーダル
GitHub
vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11
LLM
GitHub
OracleBase
Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…
★ 1 MIT 2026-06-15
LLM
GitHub
ollama-secure-gateway
このツールは、Ollamaサーバーとモバイル/ウェブアプリケーションを安全に接続するためのNode.js Expressミドルウェ…
★ 1 2026-06-18
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
動画生成
GitHub
TechDemoForge
TechDemoForgeは、技術的なREADME、仕様書、コードなどの情報源から、正確で構造化されたデモビデオを自動生成するロ…
★ 1 MIT 2026-04-12
マルチモーダル
GitHub
PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
AIエージェント
GitHub
agentos
AgentOSは、複数のAIエージェントが記憶を共有し、連携してタスクを遂行するための基盤となる「AIエージェント向けオ…
★ 1 2026-06-15
画像生成
GitHub
GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
音声生成 / TTS
GitHub
hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
AIエージェント
GitHub
AgentLoopKit
AgentLoopKitは、Codex、Claude Code、Gemini CLIなどAIコーディングエージェントが生成したコードの品質と検証可能…
★ 1 MIT 2026-06-25
音声生成 / TTS
GitHub
sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
LLM
GitHub
gha-repro-kit
gha-repro-kitは、失敗したGitHub Actionsの実行ログから、簡潔なレポートとローカルでの再現スクリプトを生成するCL…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
LLM
GitHub
Content-Vigilante
Content Vigilanteは、ブランドガイドと対象コンテンツをもとに、文章がブランドの文体や語彙、構成、読みやすさに合…
★ 1 MIT 2026-06-22
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
マルチモーダル
GitHub
vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
音声生成 / TTS
GitHub
minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
LLM
GitHub
citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
音声生成 / TTS
GitHub
omnivoice-gfx1150
このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU(gfx1150/Strix Point)上で動作…
★ 1 MIT 2026-05-30