3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

VHS

VHSは、DiTベースの画像生成における推論時の効率的なスケーリング検証フレームワークです。テキストプロンプトに基…

#CLI #GPU必須 #Hugging Face対応

★ 16 NOASSERTION 2026-03-25

3D / NeRF

GitHub

ru4dslam

RU4D-SLAMは、ガウススプラッティングSLAMにおいて不確実性の重み付けを行うことで、4Dシーン再構築を実現するシステ…

#CLI #GPU必須 #Python

★ 16 ⑂ 2 2026-06-01

ComfyUI

GitHub

ComfyClaw

ComfyClawは、ComfyUIワークフローの発見、検査、実行を可能にするCLIツールです。タグベースのパラメータ上書きとサ…

#CLI #ComfyUI対応 #Node.js

★ 16 ⑂ 6 MIT 2026-04-14

画像生成

GitHub

av-pedestrian-diffusion-mppi

このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…

#CLI #GPU必須 #Python

★ 16 ⑂ 3 MIT 2026-06-09

マルチモーダル

GitHub

GalamseyWatch

このツールは、Sentinel-2衛星画像から違法な小規模金採掘（ガラッセイ）を検出するエージェント型地球観測システム…

#AI/ML #Hugging Face #Python

★ 15 ⑂ 6 MIT 2026-05-05

3D / NeRF

GitHub

BrainDance

BrainDanceは、3D Gaussian Splatting（高斯泼溅）技術を利用して、現実空間をインタラクティブで回顧可能なホログラ…

#3DGS対応 #Python #RAG

★ 15 ⑂ 1 NOASSERTION 2026-06-24

画像生成

GitHub

JoyBoy

JoyBoyは、チャット、コーディング、画像生成、画像編集、動画実験、モデル管理といった多様なAIワークフローを統合…

#GPU必須 #Ollama対応 #Python

★ 15 ⑂ 7 Apache-2.0 2026-06-26

3D / NeRF

GitHub

SLARM

SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…

#CLI #GPU必須 #Python

★ 15 MIT 2026-06-09

LLM

GitHub

mothrag

MothRAGは、GPUやファインチューニングを必要とせず、市販のLLM APIのみで研究SOTAと同等の性能を発揮する、決定論的…

#CLI #GPU不要 #LLM API統合

★ 15 ⑂ 1 Apache-2.0 2026-06-23

動画生成

GitHub

clipforge

ClipForgeは、AIを活用してYouTubeショートやTikTok向けの短編動画を自動生成するツールです。トピックを与えるだけ…

#AI #CLI #Python

★ 15 ⑂ 3 MIT 2026-03-17

3D / NeRF

GitHub

Arbi-3DGSR

本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…

#3D #Docker #GPU必須

★ 15 ⑂ 2 MIT 2026-04-19

画像生成

GitHub

dlmserve

dlmserveは、拡散型言語モデル（Diffusion LLMs）向けにOpenAI互換のHTTPサービスを提供するツールです。拡散型LLM特…

#Docker #GPU必須 #HTTP API

★ 15 ⑂ 1 MIT 2026-05-26

音声生成 / TTS

GitHub

ringback

ringbackは、AIエージェントが電話を介してユーザーと直接対話できるModel Context Protocol (MCP) サーバーです。無…

#AIエージェント連携 #CLI #Python

★ 15 ⑂ 2 Apache-2.0 2026-06-23

マルチモーダル

GitHub

WikiSeeker

WikiSeekerは、知識ベースの視覚的質問応答（KB-VQA）のために開発された革新的なマルチモーダルRAGフレームワークで…

#CLI #LLM #Python

★ 15 Apache-2.0 2026-04-18

音声生成 / TTS

GitHub

voxtral-codec-pytoch

Voxtral Codec PyTorchは、24kHzモノラル音声波形をTTS（Text-to-Speech）トレーニング用の離散コードに変換するVoxt…

#CLI #Python #PyTorch

★ 15 ⑂ 1 2026-03-27

マルチモーダル

GitHub

Qwen3-VL-Video-Grounding

Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…

#AIモデル使用 #GPU利用 #Gradio

★ 15 ⑂ 3 Apache-2.0 2026-02-28

LLM

GitHub

citelocal-agent

docagentは、手元の論文やローカルドキュメントに対して質問し、ページ単位で正確かつ検証済みの引用付き回答を得ら…

#CLI #Ollama対応 #PDF対応

★ 15 MIT 2026-06-21

画像生成

GitHub

npedit

NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…

#CLI #GPU必須 #HuggingFace

★ 15 ⑂ 1 MIT 2026-05-05

3D / NeRF

GitHub

VLM-Instruct-FastGS

VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…

#3D Gaussian Splatting #GPU必須 #Python

★ 15 NOASSERTION 2026-03-05

マルチモーダル

GitHub

gemma-4-abliterated

「gemma-4-abliterated」は、GoogleのGemma 4 31Bモデルから、品質を損なうことなくガードレール（倫理的な制限）を…

#Apple Silicon対応 #GPU必須 #HuggingFace Model

★ 15 ⑂ 5 NOASSERTION 2026-04-03

マルチモーダル

GitHub

eyeroll

eyerollは、AIがビデオ映像を「見て、理解し、行動する」ためのツールです。画面録画、Loom動画、YouTubeリンク、ス…

#AI/LLM #Claude Code対応 #CLI

★ 15 ⑂ 1 MIT 2026-05-14

ComfyUI

GitHub

comfyui-mcp

ComfyUI MCP Serverは、AIアシスタントがComfyUIを通じて画像、動画、音声、3Dコンテンツを生成することを可能にする…

#AI生成 #CLI #ComfyUI対応

★ 15 ⑂ 3 MIT 2026-01-28

LLM

GitHub

ECG-Language-Models

このリポジトリは、ECG（心電図）言語モデル（ELM）のファインチューニングと評価のための研究フレームワークです。…

#CLI #GPU必須 #HuggingFace

★ 15 ⑂ 2 MIT 2026-06-24

音声生成 / TTS

GitHub

OmniVoice-FastAPI

OmniVoice FastAPIは、多言語対応のゼロショットTTS（Text-to-Speech）エンジン「OmniVoice」の機能を、Dockerで手軽…

#Docker #FastAPI #GPU/CPU対応

★ 15 ⑂ 2 Apache-2.0 2026-04-14