3,625 repos GH 3,510 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#CLI (1744 repos)
「CLI」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub slidoc
slidocは、講義ビデオを各スライドとそのクリーンアップされたナレーションが対になったマークダウン形式に変換する…
★ 2 ⑂ 1 MIT 2026-05-15
3D / NeRF GitHub egocentric-3d-reconstruction-demo
この「Egocentric 3D Reconstruction Demo」は、一人称視点ビデオからの3D再構築の基礎を学ぶためのインタラクティブ…
★ 2 MIT 2026-06-19
動画生成 GitHub sanatation
NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…
★ 2 Apache-2.0 2026-05-21
画像生成 GitHub Vortelio-python_libraries
Vortelio Python SDKは、ローカル環境でLLM、画像、音声、動画、3Dモデルの生成を可能にするVortelioの公式Pythonク…
★ 2 NOASSERTION 2026-06-12
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
動画生成 GitHub supercut
supercutは、AIディレクターがライブWebアプリケーションを自動的に操作し、製品の魅力を伝える60秒の映画的なローン…
★ 2 MIT 2026-06-22
ASR / 音声認識 GitHub taiwan-asr-toolkit
Taiwan ASR Toolkitは、台湾華語(繁体字中国語)に特化した高精度な音声認識ツールです。Qwen3-ASRとMediaTek Breez…
★ 2 NOASSERTION 2026-05-07
LLM GitHub memtest
MemTestは、AIメモリシステムの評価に特化したユニバーサルなベンチマーク生成ツールです。手続き型生成により依存性…
★ 2 MIT 2026-06-13
LLM GitHub Auralis
Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」(Mamba-2/GLA/Sparse-Attentionベース)を利用した…
★ 2 Apache-2.0 2026-06-19
動画生成 GitHub making-commercials-with-ltx-ai-video-guide
「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…
★ 2 Apache-2.0 2026-04-29
ASR / 音声認識 GitHub parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-23
動画生成 GitHub auto-tiktok
Auto TikTokは、Douyin/TikTokクリエイター向けのローカルファーストなAI短編動画自動生成ツールです。与えられたト…
★ 2 MIT 2026-05-21
マルチモーダル GitHub sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
LLM GitHub augmenting_historians
このPythonスクリプト群は、歴史家が自身の原稿を批判的に分析するための実験的なインフラストラクチャです。RAGアー…
★ 2 MIT 2026-06-22
音声生成 / TTS GitHub recipes
Speechstack Recipesは、音声AIエージェント構築のための実用的なオープンソースレシピ集です。Vapi、Retell、LiveKi…
★ 2 NOASSERTION 2026-06-29
音楽生成 GitHub portable-music-server
Windows向けのポータブルなマルチGPU音楽生成サーバーで、8種類のモデルを搭載。ワンクリックインストールで依存関係…
★ 2 MIT 2026-04-26
音声生成 / TTS GitHub tts-tool
「tts-tool」は、テキストやMarkdown形式のコンテンツを高品質な音声オーディオに変換するAgent Skillです。URL、Mar…
★ 2 NOASSERTION 2026-06-01
音声生成 / TTS GitHub SpeakSwiftly
SpeakSwiftlyは、macOS向けのローカルText-to-Speech(TTS)パッケージです。Swiftアプリケーション、デスクトップツ…
★ 2 Apache-2.0 2026-06-29
AIエージェント GitHub ApocData-skill
ApocDataは、中国A株市場のAIネイティブな金融データベースを提供するツールです。株価、財務データ、資金流動、各種…
★ 2 ⑂ 1 Apache-2.0 2026-06-09
画像生成 GitHub card-skill
card-skillは、Claude Codeスキルとして提供され、テキストコンテンツを洗練されたデザインのPNG画像に変換するツー…
★ 2 MIT 2026-06-26
音声生成 / TTS GitHub tianyan-tts-mobile
「天眼 TTS Mobile」は、軽量なAndroid WebViewブラウザアプリです。PaseoやZCodeの遠隔操作ページ、あるいは一般的…
★ 2 MIT 2026-06-16
画像生成 GitHub chatwalaau
ChatWalaʻauは、完全にローカルで動作するフルスタックAIエージェントランタイムです。最新のチャットUIをAG-UIプロ…
★ 2 Apache-2.0 2026-06-27
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
画像生成 GitHub image-studio
「image-studio」は、Claude Codeを活用して、CanvaなどのデザインツールやAI画像モデルなしで高品質な静的画像を生…
★ 2 MIT 2026-05-16