3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyClaw
ComfyClawは、ComfyUIワークフローの発見、検査、実行を可能にするCLIツールです。タグベースのパラメータ上書きとサ…
★ 16 ⑂ 6 MIT 2026-04-14
音声生成 / TTS
GitHub
voxtral-codec-pytoch
Voxtral Codec PyTorchは、24kHzモノラル音声波形をTTS(Text-to-Speech)トレーニング用の離散コードに変換するVoxt…
★ 15 ⑂ 1 2026-03-27
マルチモーダル
GitHub
GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
LLM
GitHub
citelocal-agent
docagentは、手元の論文やローカルドキュメントに対して質問し、ページ単位で正確かつ検証済みの引用付き回答を得ら…
★ 15 MIT 2026-06-21
画像生成
GitHub
JoyBoy
JoyBoyは、チャット、コーディング、画像生成、画像編集、動画実験、モデル管理といった多様なAIワークフローを統合…
★ 15 ⑂ 7 Apache-2.0 2026-06-26
マルチモーダル
GitHub
eyeroll
eyerollは、AIがビデオ映像を「見て、理解し、行動する」ためのツールです。画面録画、Loom動画、YouTubeリンク、ス…
★ 15 ⑂ 1 MIT 2026-05-14
動画生成
GitHub
clipforge
ClipForgeは、AIを活用してYouTubeショートやTikTok向けの短編動画を自動生成するツールです。トピックを与えるだけ…
★ 15 ⑂ 3 MIT 2026-03-17
3D / NeRF
GitHub
BrainDance
BrainDanceは、3D Gaussian Splatting(高斯泼溅)技術を利用して、現実空間をインタラクティブで回顧可能なホログラ…
★ 15 ⑂ 1 NOASSERTION 2026-06-02
画像生成
GitHub
npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
3D / NeRF
GitHub
Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
ComfyUI
GitHub
atlascloud_comfyui
atlascloud_comfyuiは、ComfyUIユーザー向けに、Atlas Cloudの300種類以上のAIモデルを直接ComfyUI内で利用可能にす…
★ 15 ⑂ 1 MIT 2026-06-26
3D / NeRF
GitHub
VLM-Instruct-FastGS
VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…
★ 15 NOASSERTION 2026-03-05
LLM
GitHub
permafrost
Permafrostは、Claude CodeとDeepSeekの間に入り、Claude Codeのプロンプト接頭辞を固定することで、DeepSeekの自動…
★ 15 ⑂ 2 MIT 2026-06-23
マルチモーダル
GitHub
WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 15 Apache-2.0 2026-04-18
マルチモーダル
GitHub
Qwen3-VL-Video-Grounding
Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…
★ 15 ⑂ 3 Apache-2.0 2026-02-28
3D / NeRF
GitHub
SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09
LLM
GitHub
mothrag
MothRAGは、GPUやファインチューニングを必要とせず、市販のLLM APIのみで研究SOTAと同等の性能を発揮する、決定論的…
★ 15 ⑂ 1 Apache-2.0 2026-06-23
LLM
GitHub
ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
画像生成
GitHub
dlmserve
dlmserveは、拡散型言語モデル(Diffusion LLMs)向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…
★ 15 ⑂ 1 MIT 2026-05-26
音声生成 / TTS
GitHub
Auris
Aurisは、EPUB、PDF、TXT形式の電子書籍をオフラインでオーディオブックとして楽しむためのツールです。ローカルで動…
★ 15 ⑂ 1 MIT 2026-05-12
音声生成 / TTS
GitHub
ringback
ringbackは、AIエージェントが電話を介してユーザーと直接対話できるModel Context Protocol (MCP) サーバーです。無…
★ 15 ⑂ 2 Apache-2.0 2026-06-23
3D / NeRF
GitHub
RetrieveVGGT
RetrieveVGGTは、トレーニング不要で長時間のストリーミング3D再構築を可能にする革新的なフレームワークです。VGGT…
★ 15 Apache-2.0 2026-05-13
3D / NeRF
GitHub
ru4dslam
RU4D-SLAMは、ガウススプラッティングSLAMにおいて不確実性の重み付けを行うことで、4Dシーン再構築を実現するシステ…
★ 15 ⑂ 2 2026-06-01
ComfyUI
GitHub
comfyui-mcp
ComfyUI MCP Serverは、AIアシスタントがComfyUIを通じて画像、動画、音声、3Dコンテンツを生成することを可能にする…
★ 14 ⑂ 3 MIT 2026-01-28