3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#CLI (1750 repos)

「CLI」タグが付いたリポジトリ

← 全リポジトリ

音楽生成
GitHub
music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
音楽生成
GitHub
sirenum
Sirenumは、任意の画像を基に、決定的かつ再現性の高い音楽を生成するツールです。楽譜(MusicXML)、MIDI、およびロ…
★ 3 ⑂ 1 AGPL-3.0 2026-04-28
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
ComfyUI
GitHub
nodeguard
nodeguardは、ComfyUIのカスタムノードやノードベースのワークフロープラグイン向けのセキュリティスキャナーです。…
★ 3 ⑂ 2 Apache-2.0 2026-05-29
AIエージェント
GitHub
HEPHAESTUS
HEPHAESTUSは、開発目標を与えるとAIエージェントが自律的にタスクを分解、実行、検証し、最終的にクリーンなコード…
★ 3 MIT 2026-06-23
動画生成
GitHub
ai-video-creator
このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…
★ 3 MIT 2026-06-11
画像生成
GitHub
gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音声生成 / TTS
GitHub
voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13
マルチモーダル
GitHub
SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
マルチモーダル
GitHub
browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
ASR / 音声認識
GitHub
pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
マルチモーダル
GitHub
opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 3 MIT 2026-06-24
画像生成
GitHub
cover-xiaohongshu
「cover-xiaohongshu」は、小紅書(Xiaohongshu)のカバー画像を生成およびレイアウトを分析するためのCodex/Claude …
★ 3 MIT 2026-05-28
3D / NeRF
GitHub
HoloScript
HoloScriptは、空間コンピューティングとAIエージェント向けのセマンティックレイヤーであり、記述された内容をVR、…
★ 3 MIT 2026-06-26
ASR / 音声認識
GitHub
streamscribe
streamscribeは、クラウドやAPIキーに依存せず、通常のCPUで動作するリアルタイム放送転写・分析ツールです。複数の…
★ 3 2026-06-11
LLM
GitHub
spaturzu-sdks
spaturzu SDKは、AIエージェントごとのLLM(大規模言語モデル)利用コストを追跡・帰属させ、予算の強制、およびプロ…
★ 3 MIT 2026-06-11
画像生成
GitHub
Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
AIエージェント
GitHub
agent-smith
agent-smithは、長期的に稼働するAIエンジニアリングエージェントを運用するためのフレームワークです。各エージェン…
★ 3 Apache-2.0 2026-06-23
音声生成 / TTS
GitHub
supertonic3-book-reader
「EPUB TTS Reader API」は、EPUBファイルをテキストに変換し、Supertonic-3モデルを使用してテキスト読み上げ(TTS…
★ 3 MIT 2026-05-15
画像生成
GitHub
gpt-image-2-skills
このツールは、Image2Studioが提供するGPT Image 2のプロンプト、画像リファレンス、視覚的な例を検索するためのエー…
★ 3 2026-04-30
LLM
GitHub
PFD-toolkit
PFD Toolkitは、Future Death (PFD) レポートの収集、スクリーニング、テーマ発見といった手作業をAIで自動化し、構…
★ 3 ⑂ 1 AGPL-3.0 2026-06-22
音声生成 / TTS
GitHub
fiona-anne
Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…
★ 3 2026-04-09
音声生成 / TTS
GitHub
auto-audiobook
「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジン…
★ 3 MIT 2026-06-27
動画生成
GitHub
video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24