3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1751 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub SpeakPro
SpeakProは、Macのターミナル(iTerm2やその他のターミナルアプリ)で選択したテキストを、ホットキー一つで自然なニ…
★ 1 MIT 2026-05-18
マルチモーダル GitHub xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
動画生成 GitHub zskyai-prompt-builder
zskyai-prompt-builderは、AIによる画像・動画生成のためのプロンプトを効率的に作成できる対話型のCLIツールです。…
★ 1 MIT 2026-05-23
動画生成 GitHub CLI-Anything
CLI-Anythingは、Windows環境のあらゆるアプリケーションをコマンドラインで操作可能にするツールです。GUI操作なし…
★ 1 2026-06-23
マルチモーダル GitHub Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
マルチモーダル GitHub DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM GitHub rag-document-engine
「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG(検索拡張生成)システムです…
★ 1 2026-06-27
AIエージェント GitHub deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
マルチモーダル GitHub multimodal-clinical-ai
このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…
★ 1 NOASSERTION 2026-05-20
3D / NeRF GitHub GaussianSplatsGradientFlow
このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …
★ 1 2026-05-16
LLM GitHub rag-agent
このツールは、本番環境に対応したRAG(検索拡張生成)とAIエージェントプラットフォームです。高密度、BM25、RRFを…
★ 1 2026-05-26
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
ASR / 音声認識 GitHub Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
LLM GitHub KnowledgeBase
KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…
★ 1 Apache-2.0 2026-06-26
マルチモーダル GitHub residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
LLM GitHub whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
動画生成 GitHub littleorange-video-mcp
LittleOrange Video MCPは、Model Context Protocol(MCP)に基づく動画生成サーバーサイドツールです。Sora2、Veo3.…
★ 1 2026-06-04
3D / NeRF GitHub splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
画像生成 GitHub amanuensis
amanuensisは、AIペルソナがMastodonやBlueskyで投稿を作成し、人間の承認を得てから公開するためのローカルファース…
★ 1 MIT 2026-06-25
画像生成 GitHub badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
動画生成 GitHub c5-video-agents
「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…
★ 0 ⑂ 1 MIT 2026-05-11
3D / NeRF GitHub GHOST
GHOST(Geometric Human Out-of-sync Spatio Temporal reconstruction)は、カジュアルな非同期マルチビュー動画から…
★ 0 MIT 2026-06-23