3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1751 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 36 ⑂ 5 2026-03-23
画像生成 GitHub codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 36 ⑂ 1 MIT 2026-06-19
3D / NeRF GitHub NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
マルチモーダル GitHub OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
LLM GitHub OneEval
OneEvalは、オープンな大規模言語モデル(LLM)の評価結果における監査の難しさや再現性の低さという課題を解決する…
★ 35 2026-03-04
音声生成 / TTS GitHub ElBruno.QwenTTS
このツールは、Qwen3-TTSモデルをONNX形式で利用し、C# .NETアプリケーションからローカルでテキスト音声合成(TTS)…
★ 35 ⑂ 5 MIT 2026-06-16
音声生成 / TTS GitHub utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
3D / NeRF GitHub msplat
rayanht/msplatは、Apple Siliconデバイス向けにMetalをフル活用した3D Gaussian Splattingのトレーニングエンジンで…
★ 34 ⑂ 10 Apache-2.0 2026-03-10
LLM GitHub polarity-agent
Polarity AIは、既存のAIの「中立性」に疑問を投げかける諷刺的なオープンソースAIエージェントフレームワークです。…
★ 34 MIT 2026-03-21
動画生成 GitHub Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
音声生成 / TTS GitHub cosyvoice.cpp
CosyVoice.cppは、CosyVoice3のPython推論パイプラインをC/C++およびGGMLに非公式に移植したプロジェクトです。これ…
★ 34 ⑂ 9 MIT 2026-06-21
LLM GitHub FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 34 ⑂ 4 MIT 2026-05-29
動画生成 GitHub seedance-api
Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…
★ 33 ⑂ 5 2026-06-24
動画生成 GitHub MaxVideoAi
MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…
★ 33 ⑂ 13 NOASSERTION 2026-06-25
画像生成 GitHub StyleExpert
StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …
★ 33 2026-03-19
3D / NeRF GitHub TRELLIS-AMD
このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU(特にROCm対応モデル)で動作するように修…
★ 33 ⑂ 3 MIT 2026-05-09
音声生成 / TTS GitHub xRIR_code
xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…
★ 33 ⑂ 1 NOASSERTION 2025-09-18
画像生成 GitHub Micro-Diffusion
Micro Diffusionは、Pythonで実装されたテキスト拡散モデルの基礎を学習するためのプロジェクトです。KarpathyのMicr…
★ 33 ⑂ 2 MIT 2026-04-13
ASR / 音声認識 GitHub franken_whisper
franken_whisperは、Rust製の先進的な自動音声認識(ASR)オーケストレーションスタックです。whisper.cpp、insanely…
★ 33 ⑂ 3 NOASSERTION 2026-06-08
LLM GitHub wayland-core
Wayland Coreは、Rustで書かれたオープンソースの自律型LLMエージェントエンジンです。主要なLLMプロバイダーと接続…
★ 33 ⑂ 8 Apache-2.0 2026-06-26
AIエージェント GitHub skill-scanner-agent
Skill Scanner Agentは、LLMエージェントベースのセキュリティスキャンツールです。SKILLディレクトリ内のセキュリテ…
★ 32 ⑂ 1 MIT 2026-05-18
マルチモーダル GitHub ARIS-Movie-Director
ARIS-Movie-Directorは、曖昧なストーリーの指示から、AIエージェントが生成と監査を行い、イメージベースのムービー…
★ 32 ⑂ 2 MIT 2026-06-26
マルチモーダル GitHub Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15
画像生成 GitHub RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06