3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1751 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
AIエージェント GitHub vscode-browser-test
このツールは、ClaudeなどのAIコーディングエージェントがVS Codeに組み込まれているブラウザツールを使って、Playwr…
★ 1 MIT 2026-06-18
音声生成 / TTS GitHub s2s
S2Sは、Rustとsherpa-onnxフレームワークを活用した、高性能で軽量なローカルSTT(音声認識)およびTTS(音声合成)A…
★ 1 GPL-3.0 2026-06-10
動画生成 GitHub seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
動画生成 GitHub comfy-prompt-skill
comfy-promptは、Comfy Cloud向けのプレミアム優先AI生成ワークフローです。50種類以上の画像および動画モデル(Gemi…
★ 1 ⑂ 1 NOASSERTION 2026-05-27
音声生成 / TTS GitHub rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
AIエージェント GitHub OhMyAgent
OhMyAgentは、永続的な記憶システムを持つ自己ホスト型AIエージェントゲートウェイであり、セッション間で情報を忘れ…
★ 1 MIT 2026-06-26
ASR / 音声認識 GitHub claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
LLM GitHub crucible-player-coach
本ツールは、GitHub上のAI関連オープンソースソフトウェアを自動で発見し、LLM(Gemini, Claudeなど)で要約・カテゴ…
★ 1 2026-06-21
ComfyUI GitHub awesome-ai-video-editing
このリポジトリは、AIを活用した動画編集および制作ツールの厳選リストです。特に、Claude Codeスキル、MCPサーバー…
★ 1 CC0-1.0 2026-06-12
マルチモーダル GitHub japan-ocr-mini-benchmark-public
このツールは、ノイズの多い合成レシート画像、グラウンドトゥルースJSON、ローカルのLM Studioベースライン結果を含…
★ 1 NOASSERTION 2026-06-21
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
3D / NeRF GitHub gmnerf
このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…
★ 1 MIT 2026-04-03
音声生成 / TTS GitHub PromptWave
PromptWaveは、テキストベースのAIプロンプトからオーディオを生成するPythonベースのシステムです。プロンプトエン…
★ 1 2025-11-29
3D / NeRF GitHub NeRF.cpp
NeRF.cppは、C++とLibTorchを用いてNeRF(Neural Radiance Fields)を実装したツールです。静止したシーンのRGB画像…
★ 1 BSD-3-Clause 2026-05-17
音声生成 / TTS GitHub Veynor
Veynorは、DiscordなどのAIエージェント向けにリアルタイム音声インタラクションを提供するオープンソースの音声ラン…
★ 1 MIT 2026-06-09
マルチモーダル GitHub MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
動画生成 GitHub obsidian-engine
Obsidian Engineは、一つのトピックから研究、脚本作成、ナレーション、映像制作、YouTubeへのアップロードまでを自…
★ 1 ⑂ 1 MIT 2026-06-26
LLM GitHub knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
ComfyUI GitHub master-canvas-hermes-plugin
Master Canvas Hermes Pluginは、AI動画プロジェクトのプリプロダクションキャンバスであるMaster CanvasのHermes Ag…
★ 1 MIT 2026-05-20
音声生成 / TTS GitHub hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル GitHub ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09