3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
Model-To-NPU
このリポジトリは、Qualcomm Snapdragonデバイス上で大規模な拡散モデルを実行するためのパイプラインを提供します。…
★ 10 ⑂ 3 NOASSERTION 2026-05-12
画像生成
GitHub
Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 10 Apache-2.0 2026-06-24
LLM
GitHub
Auto-Read-Paper
Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…
★ 10 ⑂ 9 AGPL-3.0 2026-06-03
LLM
GitHub
SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成
GitHub
PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 10 MIT 2026-05-20
AIエージェント
GitHub
web-design-enhancer
「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…
★ 10 ⑂ 2 2026-06-24
ComfyUI
GitHub
video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 10 ⑂ 1 NOASSERTION 2026-05-26
音声生成 / TTS
GitHub
mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
LLM
GitHub
vlm4ocr
vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR(光学文字認識)を可能にするPythonパッケージお…
★ 10 ⑂ 1 MIT 2026-05-05
ASR / 音声認識
GitHub
SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 10 ⑂ 2 2026-05-22
LLM
GitHub
CasualGraph
CausalGraph AIは、ESGレポートなどの長文企業報告書を分析し、検索可能なエビデンス、グラフコンテキスト、引用付き…
★ 10 ⑂ 2 2026-05-29
ComfyUI
GitHub
ComfyUI-GoRi-Wireless-Engine
GoRi-Wireless Engineは、ComfyUIの複雑なワークフローにおけるノード間の配線を無線化し、整理するツールです。ワン…
★ 10 ⑂ 1 2026-05-29
画像生成
GitHub
Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-28
AIエージェント
GitHub
web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
マルチモーダル
GitHub
cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
マルチモーダル
GitHub
goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
画像生成
GitHub
mlx-taef
mlx-taefは、Apple Silicon向けに最適化された、拡散ラテントを高速にデコードするTiny AutoEncoderライブラリです。…
★ 9 ⑂ 2 MIT 2026-07-01
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 9 ⑂ 2 GPL-3.0 2026-04-28
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
マルチモーダル
GitHub
Awesome-VLA-Safety
本リポジトリは、Vision-Language-Action(VLA)モデルの安全性に関する厳選された研究論文リストです。データ準備、…
★ 9 2026-05-20