3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

Fizgig

Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…

#ComfyUI対応 #GPU必須 #Linux対応

★ 46 ⑂ 3 Apache-2.0 2026-06-07

音声生成 / TTS

GitHub

Audio-Oscar

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…

#CLI #FFmpeg #GPU必須

★ 42 ⑂ 4 Apache-2.0 2026-06-08

LLM

GitHub

ThinkJEPA

ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…

#CLI #GPU必須 #Hugging Face

★ 42 ⑂ 5 NOASSERTION 2026-04-30

画像生成

GitHub

Coarse-guided-Gen

「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…

#CLI #GPU必須 #Python

★ 42 ⑂ 4 2026-05-08

音楽生成

GitHub

studiomi300

studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…

#AMD Instinct MI300X #CLI #GPU必須

★ 42 ⑂ 8 MIT 2026-05-22

音声生成 / TTS

GitHub

Irodori-TTS-Server

「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…

#Docker #GPU必須 #OpenAI API Compatible

★ 41 ⑂ 10 MIT 2026-06-22

マルチモーダル

music-flamingo-think-2601-hf

Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…

#CLI #GPU必須 #Python

❤ 41 ↓ 533 other 2026-04-07

LLM

GitHub

bit-brain

BitBrainは、最小限のGPUリソース（RTX 3090以上）で独自の小型LLM（miniLLM）を学習できるプロジェクトです。Qwen3-…

#CLI #GPU必須 #LLM

★ 41 ⑂ 2 Apache-2.0 2026-05-04

3D / NeRF

GitHub

OVGGT

OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…

#3D再構成 #CLI #GPU必須

★ 41 ⑂ 1 NOASSERTION 2026-06-15

3D / NeRF

GitHub

vggt-factor-refinement

このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT（Video-based General-purpose Geome…

#3D再構築 #CLI #COLMAP形式出力

★ 38 ⑂ 2 2026-06-16

マルチモーダル

GitHub

VL-Calibration

VL-Calibrationは、大規模視覚言語モデル（LVLMs）の推論における信頼性キャリブレーションを向上させるためのフレー…

#CLI #GPU必須 #Python

★ 37 Apache-2.0 2026-04-13

画像生成

GitHub

colored-noise-sampling

Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…

#CLI #GPU必須 #Python

★ 37 ⑂ 3 MIT 2026-06-01

LLM

GitHub

spark-evals

このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…

#AI/機械学習 #GPU必須 #Python

★ 36 ⑂ 1 2026-06-21

LLM

GitHub

TimeOmni-1

TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…

#GPU必須 #Hugging Face #LLM

★ 34 ⑂ 3 Apache-2.0 2026-06-12

動画生成

GitHub

Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention

LIVEditor-14Bは、文脈に即したスパースアテンション（In-Context Sparse Attention）を活用することで、動画編集に…

#CLI #GPU必須 #Hugging Face

★ 34 2026-05-15

3D / NeRF

GitHub

TRELLIS-AMD

このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU（特にROCm対応モデル）で動作するように修…

#AMD GPU対応 #CLI #GPU必須

★ 33 ⑂ 3 MIT 2026-05-09

動画生成

GitHub

seedance-api

Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…

#CLI #GPU必須 #Python

★ 33 ⑂ 5 2026-06-24

マルチモーダル

GitHub

Uni-ViGU

Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…

#CLI #Diffusionモデル #GPU必須

★ 32 ⑂ 1 Apache-2.0 2026-04-15

画像生成

GitHub

RTDMD

RTDMD（Reward-Tilted Distribution Matching Distillation）は、少ないステップ数で高品質な画像を生成する「few-st…

#CLI #GPU必須 #Python

★ 32 ⑂ 1 Apache-2.0 2026-06-06

音声生成 / TTS

GitHub

wavlm-vocoder-french

本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…

#CLI #GPU必須 #Hugging Face

★ 31 MIT 2026-05-13

ComfyUI

GitHub

Dots-TTS-ComfyUI

このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…

#ComfyUI対応 #GPU必須 #Python

★ 31 ⑂ 3 Apache-2.0 2026-06-11

ASR / 音声認識

GitHub

FastWord

FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…

#GPU必須 #macOS #Rust

★ 31 ⑂ 3 2026-05-23

3D / NeRF

GitHub

iMaC

このツールは、iMaC（Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル）と…

#CLI #Diffusers #GPU必須

★ 29 2026-06-21

音声生成 / TTS

GitHub

supertonic3-voice-clone

Supertone/supertonic-3モデル向けに、音声スタイル（.jsonファイル）を学習させるためのツールです。低GPU使用量（…

#AI/ML #Colab対応 #GPU必須

★ 29 ⑂ 8 MIT 2026-05-25