3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub ComfyUI-Olm-Liquify
Olm Liquifyは、Photoshopの「ゆがみ」ツールに着想を得たComfyUI用カスタムノードです。画像の一部をインタラクティ…
★ 17 ⑂ 2 NOASSERTION 2026-05-20
画像生成 GitHub diffusers-tuner
Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…
★ 17 MIT 2026-04-15
画像生成 GitHub av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
画像生成 GitHub IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
マルチモーダル GitHub sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 ⑂ 1 2026-03-21
ComfyUI GitHub jlc-comfyui-nodes
JLC ComfyUI Nodesは、画像生成AIツールComfyUI向けに、ControlNetの適用プロセスを大幅に改善するカスタムノード群…
★ 16 ⑂ 4 NOASSERTION 2026-06-22
LLM GitHub colsearch
ColSearchは、オンプレミスAI向けに設計された高性能なレイトインタラクション検索エンジンです。厳密なRAG(Retriev…
★ 16 ⑂ 1 NOASSERTION 2026-04-21
ComfyUI GitHub ComfyClaw
ComfyClawは、ComfyUIワークフローの発見、検査、実行を可能にするCLIツールです。タグベースのパラメータ上書きとサ…
★ 16 ⑂ 6 MIT 2026-04-14
マルチモーダル GitHub lightcone
Lightconeは、Tzafonが開発した視覚言語モデル「Northstar」のためのSDKおよびAPIです。NorthstarはGUI強化学習によ…
★ 16 ⑂ 1 Apache-2.0 2026-06-16
3D / NeRF GitHub CrossScore
CrossScoreは、ECCV 2024で発表された、マルチビュー画像の評価とスコアリングを行うための研究プロジェクトです。特…
★ 16 BSD-3-Clause 2026-03-21
LLM GitHub Awesome-LLMs-for-AI-Research
「Awesome LLMs for AI Research」は、AI研究における大規模言語モデル(LLM)の活用に関する包括的なリソース集です…
★ 16 ⑂ 4 2026-06-09
マルチモーダル GitHub UniM
UniMは、マルチモーダルな理解と生成の両方を単一のパラダイムで評価するための、初の統一されたAny-to-Anyインター…
★ 16 ⑂ 1 Apache-2.0 2026-05-30
画像生成 GitHub VHS
VHSは、DiTベースの画像生成における推論時の効率的なスケーリング検証フレームワークです。テキストプロンプトに基…
★ 16 NOASSERTION 2026-03-25
ComfyUI GitHub ComfyUI_Text_Processor
ComfyUI向けに設計された究極のテキスト処理スイートで、画像からテキストへの変換データのバッチクリーニング、LLM…
★ 16 ⑂ 2 MIT 2026-06-14
画像生成 GitHub npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
3D / NeRF GitHub Arbi-3DGSR
本ツールは、既存の3D Gaussian Splatting (3DGS) の超解像手法が抱える固定スケールレンダリングの制約を克服するた…
★ 15 ⑂ 2 MIT 2026-04-19
ComfyUI GitHub atlascloud_comfyui
atlascloud_comfyuiは、ComfyUIユーザー向けに、Atlas Cloudの300種類以上のAIモデルを直接ComfyUI内で利用可能にす…
★ 15 ⑂ 1 MIT 2026-06-26
3D / NeRF GitHub VLM-Instruct-FastGS
VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…
★ 15 NOASSERTION 2026-03-05
LLM GitHub permafrost
Permafrostは、Claude CodeとDeepSeekの間に入り、Claude Codeのプロンプト接頭辞を固定することで、DeepSeekの自動…
★ 15 ⑂ 2 MIT 2026-06-23
マルチモーダル GitHub WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 15 Apache-2.0 2026-04-18
マルチモーダル GitHub Qwen3-VL-Video-Grounding
Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…
★ 15 ⑂ 3 Apache-2.0 2026-02-28
3D / NeRF GitHub SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09
LLM GitHub mothrag
MothRAGは、GPUやファインチューニングを必要とせず、市販のLLM APIのみで研究SOTAと同等の性能を発揮する、決定論的…
★ 15 ⑂ 1 Apache-2.0 2026-06-23
LLM GitHub ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24