3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1743 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成 GitHub card-news-mcp
card-news-mcpは、テキストと背景画像からInstagramスタイル(720x720 PNG)の美しいカードニュースを自動生成するMC…
★ 1 MIT 2026-06-16
マルチモーダル GitHub tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
AIエージェント GitHub nipmod
Nipmodは、エージェントコードのための検証可能なパッケージレイヤーを提供します。Gitlawbをソースとするパッケージ…
★ 1 MIT 2026-06-13
音楽生成 GitHub synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
LLM GitHub Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
ASR / 音声認識 GitHub resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-06-25
画像生成 GitHub xhs-ai-content-studio
「AIAI Hub」は、GitHub上のAI関連オープンソースソフトウェアを自動的に発見し、WordPressサイトにカタログとして公…
★ 1 ⑂ 1 2026-06-05
3D / NeRF GitHub gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
画像生成 GitHub hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
AIエージェント GitHub top-journal-manuscript-skill
本スキルは、トップジャーナルや主要な学術誌への論文投稿を目指す研究者向けのAIエージェントスキルです。論文の計…
★ 1 MIT 2026-06-05
音楽生成 GitHub midi-sketch
midi-sketchは、ルールベースでポップミュージックのMIDIスケッチを自動生成するC++17ライブラリです。WebAssemblyで…
★ 1 Apache-2.0 2026-06-07
マルチモーダル GitHub tokensieve
tokensieveは、VLM(Vision-Language Model)を用いたVQA(Visual Question Answering)タスクにおいて、推論時の「p…
★ 1 2026-06-10
動画生成 GitHub gemini-bridge-mcp
gemini-bridge-mcpは、APIキーなしでGoogle Geminiの機能をMCP(Multi-modal Chat Protocol)サーバーとして提供する…
★ 1 MIT 2026-06-05
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
音声生成 / TTS GitHub RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
音声生成 / TTS GitHub afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-20
画像生成 GitHub grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
ASR / 音声認識 GitHub claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
3D / NeRF GitHub perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
画像生成 GitHub lobe-image-gen
Lobe Image Genは、Lobeプラットフォーム向けの画像生成スキルです。Lobeの組み込みコマンド`lh gen image`で画像を…
★ 1 2026-05-15
LLM GitHub visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20