3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#CLI (1751 repos)

「CLI」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
MirrorMetrics
MirrorMetricsは、Stable DiffusionのFace LoRA(ファインチューニングモデル)の評価に特化した科学的ベンチマーキ…
★ 58 ⑂ 8 MIT 2026-02-21
3D / NeRF
GitHub
LATO
LATOは、3Dメッシュのトポロジーを保持したまま圧縮し、効率的に生成する新しい手法を提案しています。これは、Verte…
★ 58 ⑂ 1 MIT 2026-05-14
3D / NeRF
GitHub
Robo3R
Robo3Rは、RGBフレームからリアルタイムで操作可能な3D再構築を可能にするツールです。深度センサーやキャリブレーシ…
★ 58 Apache-2.0 2026-06-21
ASR / 音声認識
GitHub
kesha-voice-kit
「Kesha Voice Kit」は、ローカル環境で動作する高速な音声処理CLIツールです。LLMエージェントや既存のツールに音声…
★ 58 ⑂ 7 MIT 2026-06-25
LLM
GitHub
nvim-mcp
nvim-mcpは、AIエージェントが実行中のNeovimセッションに直接アクセスできるようにするMCP(Model Context Protocol…
★ 58 ⑂ 5 MIT 2026-05-19
LLM
GitHub
symfony-security-auditor
このツールは、AI駆動のマルチエージェントセキュリティ監査ツールで、Symfonyアプリケーションのビジネスロジックの…
★ 58 MIT 2026-06-24
マルチモーダル
GitHub
GEditBench_v2
GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…
★ 57 ⑂ 1 2026-06-18
3D / NeRF
GitHub
diff-surfel-tracing
このツールは、2D Gaussian Splatting(2DGS)とNVIDIA OptiXを基盤とした、差分可能な2Dガウスレイトレーサーです。…
★ 57 ⑂ 4 NOASSERTION 2025-10-14
音声生成 / TTS
GitHub
become-ceo
「Become CEO」は、Discord上でAIエグゼクティブチームを構築するツールです。エンジニアリング、財務、マーケティン…
★ 57 ⑂ 8 MIT 2026-03-13
マルチモーダル
HF
audio-flamingo-next-hf
Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。音声Q&A、文字…
❤ 56 ↓ 8.0k other 2026-05-13
LLM
GitHub
dmlx
dmlxは、AppleのMLX Metalバックエンドと5層のメモリ最適化技術を組み合わせることで、Mac上で大規模なフロンティアL…
★ 56 ⑂ 4 MIT 2026-06-20
ASR / 音声認識
GitHub
whisrs
whisrsは、Linux向けに特化して開発されたRust製の音声テキスト変換(ボイスtoテキスト)ディクテーションツールです…
★ 55 ⑂ 16 MIT 2026-06-21
3D / NeRF
GitHub
dvlt.cu
dvlt.cuは、NVIDIAのDVLT (Déjà View Looping Transformer) をCUDA/C++で再実装した、依存関係のない高速な3D再構築…
★ 55 ⑂ 8 Apache-2.0 2026-06-04
AIエージェント
GitHub
Threatswarm
ThreatSwarmは、27のAIエージェントを活用し、偵察からエクスプロイト、ポストエクスプロイト、DFIR、CVSSスコア付き…
★ 55 ⑂ 13 MIT 2026-04-29
マルチモーダル
GitHub
OmniVideo-100K
「OmniVideo-100K」は、音声・視覚推論能力の向上を目指す大規模データセットと、そのための自動データ合成エンジン…
★ 54 ⑂ 2 Apache-2.0 2026-06-19
音声生成 / TTS
GitHub
qwen3-tts
gabriele-mastrapasqua/qwen3-ttsは、Qwen3-TTSテキスト読み上げモデル(0.6Bおよび1.7B)向けの軽量かつクロスプラ…
★ 54 ⑂ 10 MIT 2026-06-07
LLM
GitHub
deepcloak
DeepCloakは、Cloudflare、Datadome、Turnstile、reCAPTCHAなどのボットウォールによってブロックされるウェブページ…
★ 54 ⑂ 8 MIT 2026-06-05
3D / NeRF
GitHub
EcoSplat
EcoSplatは、効率制御可能なフィードフォワード3D Gaussian Splatting技術を実装したツールです。マルチビュー画像か…
★ 53 ⑂ 2 MIT 2026-06-11
LLM
GitHub
memexa
Memexaは、AIエージェントと人間が中国語のデータを扱うための自己ホスト型記憶グラフツールです。WeChat、QQ、飛書…
★ 53 ⑂ 4 Apache-2.0 2026-06-27
画像生成
GitHub
LeapAlign_Code
LeapAlignは、フローマッチングモデルを人間の好みに合わせて微調整するための学習後手法です。完全なサンプリング軌…
★ 53 ⑂ 1 Apache-2.0 2026-06-13
ASR / 音声認識
GitHub
doubao-murmur
Doubao Murmurは、豆包(doubao.com)のWeb音声認識機能を活用したミニマルな音声入力ツールです。macOSとLinux/Stea…
★ 52 ⑂ 1 MIT 2026-06-13
音声生成 / TTS
GitHub
cadis
C.A.D.I.S.は、Rustを優先し、ローカルファーストでモデルに依存しないマルチエージェントランタイムです。単一のデ…
★ 52 ⑂ 11 NOASSERTION 2026-05-31
3D / NeRF
GitHub
metaquest-3d-reconstruction
本ツールは、Meta Questデバイスでキャプチャされたパススルー画像と深度データを用いて3Dシーンを再構築するための…
★ 51 ⑂ 11 MIT 2026-06-23
ASR / 音声認識
GitHub
voicetag
voicetagは、Pythonで書かれた話者分離および話者識別ライブラリです。pyannote.audioとresemblyzerを組み合わせて「…
★ 51 ⑂ 5 MIT 2026-03-16