3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
画像生成
GitHub
pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 3 MIT 2026-06-17
ASR / 音声認識
GitHub
doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
LLM
GitHub
Learn-RAG-from-scratch
本プロジェクトは、Retrieval-Augmented Generation (RAG) システムをゼロから手動で構築し、学習することに特化して…
★ 3 2026-06-14
画像生成
GitHub
gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
AIエージェント
GitHub
HEPHAESTUS
HEPHAESTUSは、開発目標を与えるとAIエージェントが自律的にタスクを分解、実行、検証し、最終的にクリーンなコード…
★ 3 MIT 2026-06-23
音声生成 / TTS
GitHub
ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
LLM
GitHub
Summer-inland-waterway-communication-dataset
LLIPSEは、内陸水路における船と陸間の通信のEnd-to-End遅延を予測するための軽量なLLM(大規模言語モデル)ベースの…
★ 3 ⑂ 2 MIT 2026-05-27
音声生成 / TTS
GitHub
kokoro-server
「kokoro-infer」は、高速で軽量なKokoro-82M TTS(Text-to-Speech)推論エンジンおよびサーバーです。CPU、CUDA、そ…
★ 3 2026-05-31
3D / NeRF
GitHub
spz
.SPZファイル形式のRust実装を提供し、この形式を扱うためのCLIツールです。PythonとC言語のバインディングも利用で…
★ 3 ⑂ 2 Apache-2.0 2026-06-20
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
マルチモーダル
GitHub
Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 3 MIT 2026-05-10
マルチモーダル
GitHub
browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
音声生成 / TTS
GitHub
AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ComfyUI
GitHub
ComfyUI-NVML-Monitor
ComfyUI-NVML-Monitorは、ComfyUI上でNVIDIA製GPUのリアルタイムハードウェア監視を可能にする軽量な拡張機能です。C…
★ 3 ⑂ 1 MIT 2026-06-02
動画生成
GitHub
ComfyUI-MediaHub
ComfyUI MediaHubは、クラウドベースの画像および動画生成APIを、構成可能でクリーンなComfyUIワークフローに統合す…
★ 3 ⑂ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
harry-ai
Harryは、macOS向けに設計された音声のみのAIアシスタントです。映画「JARVIS / FRIDAY」のような体験を提供し、洗練…
★ 3 MIT 2026-05-26
3D / NeRF
GitHub
gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
音声生成 / TTS
GitHub
gemini-khmer-translator
このオープンソースツールは、GoogleのGemini 2.5と3.1 TTSを活用し、英語の動画コンテンツを高品質なクメール語に自…
★ 3 ⑂ 3 MIT 2026-05-15
マルチモーダル
GitHub
langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-06-03
LLM
GitHub
mdrouter
mdrouterは、OpenAI、Ollama、Anthropicといった複数のLLMプロバイダーに対応したルーターです。低コスト、低遅延、…
★ 3 MIT 2026-06-21
LLM
GitHub
grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
動画生成
GitHub
prvod
PRVODは、GitHubのプルリクエストをナレーション付きのウォークスルービデオに自動変換するツールです。大規模な差分…
★ 3 ⑂ 3 NOASSERTION 2026-06-22