3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1744 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub oai-tts-router
このツールは、OpenAI TTS互換のAPIインターフェースを提供する無料のTTSルーターです。Google Translate、Edge TTS…
★ 7 AGPL-3.0 2026-05-19
ASR / 音声認識 GitHub Fast-Sub
Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…
★ 7 MIT 2026-06-30
LLM GitHub RAG-Roadmap-with-Notes-and-Projects
このリポジトリは、Retrieval-Augmented Generation(RAG)の学習に特化した、基礎から本番環境でのエージェントRAG…
★ 7 MIT 2026-06-21
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
AIエージェント GitHub harn
HarnはAIエージェントをオーケストレーションするためのプログラミング言語とランタイムです。製品コードとプロバイ…
★ 7 Apache-2.0 2026-07-01
画像生成 GitHub comfyui-lance-aio
ComfyUI Lance AIOは、ByteDance Lance-3BモデルをComfyUIで実行するためのカスタムノードを提供するリポジトリです…
★ 7 ⑂ 2 MIT 2026-06-08
画像生成 GitHub gosd
「gosd」は、Go言語で直接Stable Diffusionモデルの推論を可能にする高性能なライブラリです。stable-diffusion.cpp…
★ 7 MIT 2026-06-06
LLM GitHub reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 7 MIT 2026-06-28
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
音楽生成 GitHub ACE-Step-Installer
このツールは、ACE-Step 1.5 AI音楽生成モデルをWindowsおよびLinuxにワンクリックでインストールする自動化されたオ…
★ 7 ⑂ 1 GPL-3.0 2026-05-01
画像生成 GitHub scientific-visual-skills
本プロジェクトは、CodexおよびChatGPTの画像生成ワークフロー向けの科研ビジュアルスキルパックです。科研、医学、…
★ 7 ⑂ 3 MIT 2026-06-18
ComfyUI GitHub codex-skill-eastern-beauty-director
このCodexスキルは、「東方美人シリーズ」のAI画像生成プロンプトをディレクターレベルで提供します。古風、東方幻想…
★ 7 ⑂ 3 MIT 2026-06-17
音声生成 / TTS GitHub lora-cosyvoice123-chanting
このリポジトリは、中国語の古詩詞吟誦に特化したCosyVoice 1/2/3 LoRA微調整実験フレームワークです。CosyVoiceの三…
★ 7 2026-06-18
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
音声生成 / TTS GitHub book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
音声生成 / TTS GitHub okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
マルチモーダル GitHub wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
LLM GitHub agentic-workspace-core
このツールは、Daaaaave/agentic-workspace-coreという、コーディングエージェントのためのポータブルなワークスペー…
★ 6 MIT 2026-06-11
AIエージェント GitHub otto
ottoは、AIエージェントの行動を改善・永続化するための「行動層」を提供するツールです。エージェントが過去の修正…
★ 6 ⑂ 1 MIT 2026-06-22
画像生成 GitHub spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10
ASR / 音声認識 GitHub game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-11