3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
動画生成
GitHub
video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24
マルチモーダル
GitHub
tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
LLM
GitHub
ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS
GitHub
MiniBox
MiniBoxは、GPT-SoVITSによる高品質な音声合成とクラウドLLMを組み合わせた、キャラクターボイスチャットボットです…
★ 3 ⑂ 2 MIT 2026-06-08
画像生成
GitHub
gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音声生成 / TTS
GitHub
jarvis-ai
J.A.R.V.I.S.は、Linux上で動作するローカルの音声駆動型AIオペレーターです。Claude Pro、OpenRouter、またはOllama…
★ 3 ⑂ 2 MIT 2026-06-17
音声生成 / TTS
GitHub
ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
LLM
GitHub
Summer-inland-waterway-communication-dataset
LLIPSEは、内陸水路における船と陸間の通信のEnd-to-End遅延を予測するための軽量なLLM(大規模言語モデル)ベースの…
★ 3 ⑂ 2 MIT 2026-05-27
3D / NeRF
GitHub
m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 3 MIT 2026-05-10
マルチモーダル
GitHub
browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
音声生成 / TTS
GitHub
AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ComfyUI
GitHub
ComfyUI-NVML-Monitor
ComfyUI-NVML-Monitorは、ComfyUI上でNVIDIA製GPUのリアルタイムハードウェア監視を可能にする軽量な拡張機能です。C…
★ 3 ⑂ 1 MIT 2026-06-02
LLM
GitHub
whatifd
whatifdは、LLM(大規模言語モデル)システムにおけるプロンプト、モデル、ツールの変更がもたらす影響を客観的に評…
★ 3 ⑂ 1 Apache-2.0 2026-06-22
AIエージェント
GitHub
Thread-Contract-mcp
Thread Contractは、AIコーディングエージェント向けの対話スレッドに特化したランタイム契約レイヤーです。ユーザー…
★ 3 MIT 2026-06-03
3D / NeRF
GitHub
gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
LLM
GitHub
RAG-Lab
「RAG-Lab」は、Retrieval-Augmented Generation(検索拡張生成)の原理から実装までを実践的に学べる実験プロジェク…
★ 3 ⑂ 1 MIT 2026-06-01
音楽生成
GitHub
onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
LLM
GitHub
grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
3D / NeRF
GitHub
Mono-HDR-3D
Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ(LDR)画像から高ダイナミックレンジ(HDR…
★ 3 Apache-2.0 2026-04-27
画像生成
GitHub
mlx-lm-server
Ar9av/mlx-lm-serverは、Apple Siliconを搭載したMac向けに開発された、OpenAI互換のローカル推論サーバーです。LLM…
★ 3 MIT 2026-06-23