3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

Audio-Oscar

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…

#CLI #FFmpeg #GPU必須

★ 42 ⑂ 4 Apache-2.0 2026-06-08

音声生成 / TTS

GitHub

Irodori-TTS-Server

「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…

#Docker #GPU必須 #OpenAI API Compatible

★ 41 ⑂ 10 MIT 2026-06-22

マルチモーダル

music-flamingo-think-2601-hf

Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…

#CLI #GPU必須 #Python

❤ 41 ↓ 533 other 2026-04-07

LLM

GitHub

bit-brain

BitBrainは、最小限のGPUリソース（RTX 3090以上）で独自の小型LLM（miniLLM）を学習できるプロジェクトです。Qwen3-…

#CLI #GPU必須 #LLM

★ 41 ⑂ 2 Apache-2.0 2026-05-04

ComfyUI

GitHub

ComfyUI-FBCNN

「ComfyUI-FBCNN」は、人気の画像生成UI「ComfyUI」に、JPEG画像の圧縮ノイズ（アーティファクト）除去に特化したFBC…

#ComfyUI対応 #GPU必須 #Python

★ 41 ⑂ 7 GPL-3.0 2025-02-24

3D / NeRF

GitHub

OVGGT

OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…

#3D再構成 #CLI #GPU必須

★ 41 ⑂ 1 NOASSERTION 2026-06-15

ComfyUI

GitHub

ComfyUI-sudo-latent-upscale

ComfyUI向けの潜在空間アップスケール用カスタム実装・モデル集です。画像をRGBで拡大してから再エンコードするので…

#ComfyUI対応 #GPU必須 #Python

★ 40 ⑂ 7 BSD-3-Clause 2024-05-22

ComfyUI

GitHub

ComfyUI-MediaMixer

「MediaMixer」は、ComfyUI向けの動画ユーティリティノード集です。動画結合、最終・初回フレーム抽出、YouTube動画…

#ComfyUI対応 #GPU必須

★ 39 ⑂ 8 CC0-1.0 2024-12-05

ComfyUI

GitHub

ComfyUI-Img2Img-Turbo

このツールは、人気の画像生成UIであるComfyUIのImg2Img機能を高速化するための拡張機能です。GaParmar氏のImg2Img-T…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 39 ⑂ 7 MIT 2024-05-22

3D / NeRF

GitHub

vggt-factor-refinement

このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT（Video-based General-purpose Geome…

#3D再構築 #CLI #COLMAP形式出力

★ 38 ⑂ 2 2026-06-16

ComfyUI

GitHub

ComfyUI-OpenPose

このリポジトリは、OpenPoseモデルを使用して人間のポーズキーポイントを抽出し、視覚化するPython実装を提供します…

#ComfyUI対応 #GPU必須 #Python

★ 38 ⑂ 5 GPL-3.0 2024-07-31

マルチモーダル

GitHub

VL-Calibration

VL-Calibrationは、大規模視覚言語モデル（LVLMs）の推論における信頼性キャリブレーションを向上させるためのフレー…

#CLI #GPU必須 #Python

★ 37 Apache-2.0 2026-04-13

画像生成

GitHub

colored-noise-sampling

Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…

#CLI #GPU必須 #Python

★ 37 ⑂ 3 MIT 2026-06-01

3D / NeRF

GitHub

NeRAF

NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…

#CLI #GPU必須 #Hugging Face

★ 36 ⑂ 2 NOASSERTION 2026-03-11

マルチモーダル

GitHub

synthvision

SynthVisionは、医療画像VQA（Visual Question Answering）データセットの生成と、それを用いたVLM（Vision Language…

#CLI #GPU必須 #Hugging Face

★ 36 ⑂ 5 2026-03-23

LLM

GitHub

spark-evals

このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…

#AI/機械学習 #GPU必須 #Python

★ 36 ⑂ 1 2026-06-21

動画生成

GitHub

Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention

LIVEditor-14Bは、文脈に即したスパースアテンション（In-Context Sparse Attention）を活用することで、動画編集に…

#CLI #GPU必須 #Hugging Face

★ 34 2026-05-15

3D / NeRF

GitHub

msplat

rayanht/msplatは、Apple Siliconデバイス向けにMetalをフル活用した3D Gaussian Splattingのトレーニングエンジンで…

#Apple Silicon対応 #C++ #CLI

★ 34 ⑂ 10 Apache-2.0 2026-03-10

LLM

GitHub

TimeOmni-1

TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…

#GPU必須 #Hugging Face #LLM

★ 34 ⑂ 3 Apache-2.0 2026-06-12

ComfyUI

GitHub

ComfyUI-Hunyuan-Image-3

ComfyUI上でTencentのHunyuan Image 3.0を使った基本的な画像生成を行うためのカスタムノードです。テキストプロンプ…

#ComfyUI対応 #GPU必須

★ 33 ⑂ 6 MIT 2025-10-15

音声生成 / TTS

GitHub

xRIR_code

xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…

#CLI #GPU必須 #Python

★ 33 ⑂ 1 NOASSERTION 2025-09-18

LLM

GitHub

attn_res

このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…

#GPU必須 #Python #PyTorch

★ 33 ⑂ 3 Apache-2.0 2026-03-16

画像生成

GitHub

StyleExpert

StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …

#CLI #GPU必須 #HuggingFace対応

★ 33 2026-03-19

3D / NeRF

GitHub

TRELLIS-AMD

このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU（特にROCm対応モデル）で動作するように修…

#AMD GPU対応 #CLI #GPU必須

★ 33 ⑂ 3 MIT 2026-05-09