3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyUI-MultiModal-Prompt-Nodes
ComfyUI-MultiModal-Prompt-Nodesは、ComfyUIユーザー向けのマルチモーダルプロンプト生成ツールです。Qwen-Image-Ed…
★ 11 ⑂ 5 NOASSERTION 2026-06-16
3D / NeRF
GitHub
SplAttN
SplAttNは、3D点群補完のための公式PyTorch実装です。従来の2D投影で生じる「クロスモーダルエントロピー崩壊」問題…
★ 11 ⑂ 1 MIT 2026-06-16
動画生成
GitHub
phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 11 NOASSERTION 2026-06-08
AIエージェント
GitHub
dos-kernel
DOS (Dispatch Operating System) は、自律型AIエージェントの作業結果を検証するための信頼基盤を提供するツールで…
★ 11 ⑂ 3 MIT 2026-06-25
音声生成 / TTS
GitHub
minipet-overlay
デスクトップオーバーレイ形式のAIプログラミングパートナー「minipet-overlay」は、アニメーションと音声でコーディ…
★ 11 ⑂ 1 2026-04-21
LLM
GitHub
Auto-Read-Paper
Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…
★ 10 ⑂ 9 AGPL-3.0 2026-06-03
画像生成
GitHub
Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
LLM
GitHub
SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成
GitHub
PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 10 MIT 2026-05-20
LLM
GitHub
guia-de-programacion-con-ai
このガイドは、AIを活用したプログラミングとソフトウェア開発を学ぶためのスペイン語で書かれた最も包括的なリソー…
★ 10 MIT 2026-06-15
LLM
GitHub
CasualGraph
CausalGraph AIは、ESGレポートなどの長文企業報告書を分析し、検索可能なエビデンス、グラフコンテキスト、引用付き…
★ 10 ⑂ 2 2026-05-29
AIエージェント
GitHub
web-design-enhancer
「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…
★ 10 ⑂ 2 2026-06-24
画像生成
GitHub
tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
ComfyUI
GitHub
ComfyUI-GoRi-Wireless-Engine
GoRi-Wireless Engineは、ComfyUIの複雑なワークフローにおけるノード間の配線を無線化し、整理するツールです。ワン…
★ 10 ⑂ 1 2026-05-29
ComfyUI
GitHub
Codex-Integration-with-Creative-Industry-Software
StarBridgeは、Windows環境で動作するローカルファーストのMCP stdioサーバーであり、AIエージェントをComfyUI、Blen…
★ 10 ⑂ 2 MIT 2026-06-24
音声生成 / TTS
GitHub
mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
LLM
GitHub
vlm4ocr
vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR(光学文字認識)を可能にするPythonパッケージお…
★ 10 ⑂ 1 MIT 2026-05-05
ASR / 音声認識
GitHub
SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 10 ⑂ 2 2026-05-22
動画生成
GitHub
Model-To-NPU
このリポジトリは、Qualcomm Snapdragonデバイス上で大規模な拡散モデルを実行するためのパイプラインを提供します。…
★ 10 ⑂ 3 NOASSERTION 2026-05-12
マルチモーダル
GitHub
goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
ASR / 音声認識
GitHub
afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19