3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
ODE-GS
ODE-GSは、ICLR 2026で発表された「Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting」の公…
★ 12 ⑂ 2 MIT 2026-04-25
3D / NeRF
GitHub
SceneAligner
SceneAlignerは、様々な実環境画像とラスタライズされたフロアプランを入力として、画像から重力に沿った3D点群を再…
★ 12 2026-05-22
動画生成
GitHub
NanoI2V
NanoI2Vは、最先端の画像-動画変換(I2V)モデルをゼロから構築するためのステップバイステップのガイドです。拡散ベ…
★ 12 MIT 2026-06-19
ASR / 音声認識
GitHub
qwen3-asr-mt
このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR(自動音声認識)サーバーです。オリジナルのFlaskデ…
★ 11 ⑂ 1 Apache-2.0 2026-06-08
3D / NeRF
GitHub
SplAttN
SplAttNは、3D点群補完のための公式PyTorch実装です。従来の2D投影で生じる「クロスモーダルエントロピー崩壊」問題…
★ 11 ⑂ 1 MIT 2026-06-16
音楽生成
GitHub
Foundation-Music-Lab
Foundation Music Labは、Stable AudioをベースにFoundation_1モデルに最適化されたポータブルなAI音楽生成ツールで…
★ 11 ⑂ 2 MIT 2026-04-16
画像生成
GitHub
Text-to-Motion
Text-to-Motionは、テキストプロンプトからG1 Unitreeヒューマノイドロボット用の参照モーションを生成するプロジェ…
★ 11 2026-06-15
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
画像生成
GitHub
Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
動画生成
GitHub
phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 10 NOASSERTION 2026-06-08
画像生成
GitHub
DiffusionCreamPy
DiffusionCreamPyは、最新のAIモデルを活用してヘンタイ画像からバーやモザイクといった検閲を解除するツールです。D…
★ 10 CC-BY-4.0 2026-05-13
画像生成
GitHub
tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
マルチモーダル
GitHub
mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 9 ⑂ 1 MIT 2026-06-23
マルチモーダル
GitHub
SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
ComfyUI
GitHub
video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 9 ⑂ 1 NOASSERTION 2026-05-26
音声生成 / TTS
GitHub
omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
画像生成
GitHub
mlx-taef
mlx-taefは、Apple Silicon向けに最適化された、拡散ラテントを高速にデコードするTiny AutoEncoderライブラリです。…
★ 9 ⑂ 2 MIT 2026-06-23
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
画像生成
GitHub
Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 9 Apache-2.0 2026-06-24
3D / NeRF
GitHub
SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07