3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub ComfyUI-MultiModal-Prompt-Nodes
ComfyUI-MultiModal-Prompt-Nodesは、ComfyUIユーザー向けのマルチモーダルプロンプト生成ツールです。Qwen-Image-Ed…
★ 11 ⑂ 5 NOASSERTION 2026-06-16
3D / NeRF GitHub SplAttN
SplAttNは、3D点群補完のための公式PyTorch実装です。従来の2D投影で生じる「クロスモーダルエントロピー崩壊」問題…
★ 11 ⑂ 1 MIT 2026-06-16
動画生成 GitHub phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 11 NOASSERTION 2026-06-08
AIエージェント GitHub dos-kernel
DOS (Dispatch Operating System) は、自律型AIエージェントの作業結果を検証するための信頼基盤を提供するツールで…
★ 11 ⑂ 3 MIT 2026-06-25
音声生成 / TTS GitHub minipet-overlay
デスクトップオーバーレイ形式のAIプログラミングパートナー「minipet-overlay」は、アニメーションと音声でコーディ…
★ 11 ⑂ 1 2026-04-21
LLM GitHub Auto-Read-Paper
Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…
★ 10 ⑂ 9 AGPL-3.0 2026-06-03
画像生成 GitHub Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
画像生成 GitHub windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
LLM GitHub SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成 GitHub PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 10 MIT 2026-05-20
LLM GitHub guia-de-programacion-con-ai
このガイドは、AIを活用したプログラミングとソフトウェア開発を学ぶためのスペイン語で書かれた最も包括的なリソー…
★ 10 MIT 2026-06-15
動画生成 GitHub ltx-video-mlx
ltx-video-mlxは、Apple Silicon(M1以降のMac)上でMLXを活用し、PyTorchなしでLTX-2.3モデル(22B)による高性能な…
★ 10 ⑂ 3 2026-04-11
LLM GitHub CasualGraph
CausalGraph AIは、ESGレポートなどの長文企業報告書を分析し、検索可能なエビデンス、グラフコンテキスト、引用付き…
★ 10 ⑂ 2 2026-05-29
AIエージェント GitHub web-design-enhancer
「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…
★ 10 ⑂ 2 2026-06-24
画像生成 GitHub tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
ComfyUI GitHub ComfyUI-GoRi-Wireless-Engine
GoRi-Wireless Engineは、ComfyUIの複雑なワークフローにおけるノード間の配線を無線化し、整理するツールです。ワン…
★ 10 ⑂ 1 2026-05-29
ComfyUI GitHub Codex-Integration-with-Creative-Industry-Software
StarBridgeは、Windows環境で動作するローカルファーストのMCP stdioサーバーであり、AIエージェントをComfyUI、Blen…
★ 10 ⑂ 2 MIT 2026-06-24
3D / NeRF GitHub 3D-RGBX
「3D-RGBX」は、CVPR 2026で注目された研究プロジェクトであり、キャリブレーションや深度情報なしで3Dの一貫性を保…
★ 10 ⑂ 2 MIT 2026-06-06
音声生成 / TTS GitHub mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
LLM GitHub vlm4ocr
vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR(光学文字認識)を可能にするPythonパッケージお…
★ 10 ⑂ 1 MIT 2026-05-05
ASR / 音声認識 GitHub SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 10 ⑂ 2 2026-05-22
動画生成 GitHub Model-To-NPU
このリポジトリは、Qualcomm Snapdragonデバイス上で大規模な拡散モデルを実行するためのパイプラインを提供します。…
★ 10 ⑂ 3 NOASSERTION 2026-05-12
マルチモーダル GitHub goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
ASR / 音声認識 GitHub afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19