3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 42 ⑂ 4 Apache-2.0 2026-06-08
音声生成 / TTS
GitHub
Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 41 ⑂ 10 MIT 2026-06-22
マルチモーダル
HF
music-flamingo-think-2601-hf
Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…
❤ 41 ↓ 533 other 2026-04-07
LLM
GitHub
bit-brain
BitBrainは、最小限のGPUリソース(RTX 3090以上)で独自の小型LLM(miniLLM)を学習できるプロジェクトです。Qwen3-…
★ 41 ⑂ 2 Apache-2.0 2026-05-04
ComfyUI
GitHub
ComfyUI-FBCNN
「ComfyUI-FBCNN」は、人気の画像生成UI「ComfyUI」に、JPEG画像の圧縮ノイズ(アーティファクト)除去に特化したFBC…
★ 41 ⑂ 7 GPL-3.0 2025-02-24
3D / NeRF
GitHub
OVGGT
OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…
★ 41 ⑂ 1 NOASSERTION 2026-06-15
ComfyUI
GitHub
ComfyUI-sudo-latent-upscale
ComfyUI向けの潜在空間アップスケール用カスタム実装・モデル集です。画像をRGBで拡大してから再エンコードするので…
★ 40 ⑂ 7 BSD-3-Clause 2024-05-22
ComfyUI
GitHub
ComfyUI-MediaMixer
「MediaMixer」は、ComfyUI向けの動画ユーティリティノード集です。動画結合、最終・初回フレーム抽出、YouTube動画…
★ 39 ⑂ 8 CC0-1.0 2024-12-05
ComfyUI
GitHub
ComfyUI-Img2Img-Turbo
このツールは、人気の画像生成UIであるComfyUIのImg2Img機能を高速化するための拡張機能です。GaParmar氏のImg2Img-T…
★ 39 ⑂ 7 MIT 2024-05-22
3D / NeRF
GitHub
vggt-factor-refinement
このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT(Video-based General-purpose Geome…
★ 38 ⑂ 2 2026-06-16
ComfyUI
GitHub
ComfyUI-OpenPose
このリポジトリは、OpenPoseモデルを使用して人間のポーズキーポイントを抽出し、視覚化するPython実装を提供します…
★ 38 ⑂ 5 GPL-3.0 2024-07-31
マルチモーダル
GitHub
VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
3D / NeRF
GitHub
NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
マルチモーダル
GitHub
synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 36 ⑂ 5 2026-03-23
LLM
GitHub
spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
3D / NeRF
GitHub
msplat
rayanht/msplatは、Apple Siliconデバイス向けにMetalをフル活用した3D Gaussian Splattingのトレーニングエンジンで…
★ 34 ⑂ 10 Apache-2.0 2026-03-10
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
ComfyUI
GitHub
ComfyUI-Hunyuan-Image-3
ComfyUI上でTencentのHunyuan Image 3.0を使った基本的な画像生成を行うためのカスタムノードです。テキストプロンプ…
★ 33 ⑂ 6 MIT 2025-10-15
音声生成 / TTS
GitHub
xRIR_code
xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…
★ 33 ⑂ 1 NOASSERTION 2025-09-18
LLM
GitHub
attn_res
このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…
★ 33 ⑂ 3 Apache-2.0 2026-03-16
画像生成
GitHub
StyleExpert
StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …
★ 33 2026-03-19
3D / NeRF
GitHub
TRELLIS-AMD
このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU(特にROCm対応モデル)で動作するように修…
★ 33 ⑂ 3 MIT 2026-05-09