3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
動画生成 GitHub video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24
マルチモーダル GitHub tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-06-23
ASR / 音声認識 GitHub claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS GitHub MiniBox
MiniBoxは、GPT-SoVITSによる高品質な音声合成とクラウドLLMを組み合わせた、キャラクターボイスチャットボットです…
★ 3 ⑂ 2 MIT 2026-06-08
AIエージェント GitHub ironclad
Ironcladは、大規模言語モデル(LLM)エージェントの信頼性を、モデルサイズではなく厳格な制約と強制によって実現す…
★ 3 Apache-2.0 2026-06-26
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音声生成 / TTS GitHub jarvis-ai
J.A.R.V.I.S.は、Linux上で動作するローカルの音声駆動型AIオペレーターです。Claude Pro、OpenRouter、またはOllama…
★ 3 ⑂ 2 MIT 2026-06-17
音声生成 / TTS GitHub ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
LLM GitHub Summer-inland-waterway-communication-dataset
LLIPSEは、内陸水路における船と陸間の通信のEnd-to-End遅延を予測するための軽量なLLM(大規模言語モデル)ベースの…
★ 3 ⑂ 2 MIT 2026-05-27
3D / NeRF GitHub m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
マルチモーダル GitHub Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 3 MIT 2026-05-10
マルチモーダル GitHub browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
音声生成 / TTS GitHub AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ComfyUI GitHub ComfyUI-NVML-Monitor
ComfyUI-NVML-Monitorは、ComfyUI上でNVIDIA製GPUのリアルタイムハードウェア監視を可能にする軽量な拡張機能です。C…
★ 3 ⑂ 1 MIT 2026-06-02
LLM GitHub whatifd
whatifdは、LLM(大規模言語モデル)システムにおけるプロンプト、モデル、ツールの変更がもたらす影響を客観的に評…
★ 3 ⑂ 1 Apache-2.0 2026-06-22
AIエージェント GitHub Thread-Contract-mcp
Thread Contractは、AIコーディングエージェント向けの対話スレッドに特化したランタイム契約レイヤーです。ユーザー…
★ 3 MIT 2026-06-03
3D / NeRF GitHub gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
LLM GitHub RAG-Lab
「RAG-Lab」は、Retrieval-Augmented Generation(検索拡張生成)の原理から実装までを実践的に学べる実験プロジェク…
★ 3 ⑂ 1 MIT 2026-06-01
音楽生成 GitHub onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
LLM GitHub grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
3D / NeRF GitHub Mono-HDR-3D
Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ(LDR)画像から高ダイナミックレンジ(HDR…
★ 3 Apache-2.0 2026-04-27
画像生成 GitHub mlx-lm-server
Ar9av/mlx-lm-serverは、Apple Siliconを搭載したMac向けに開発された、OpenAI互換のローカル推論サーバーです。LLM…
★ 3 MIT 2026-06-23