3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

ora

Oraは、macOS向けのリアルタイムローカル音声翻訳アプリケーションです。Apple Silicon Mac上で動作し、全ての処理を…

#Apple Silicon #GPU必須 #GUI

★ 48 ⑂ 4 MIT 2026-06-04

ComfyUI

GitHub

ComfyUI-YCNodes

ComfyUI-YCNodesは、人気の画像生成Web UI「ComfyUI」向けに特化した画像処理拡張ノード集です。画像ミラー、回転、…

#ComfyUI対応 #GPU必須 #中国語対応

★ 46 ⑂ 2 MIT 2026-05-09

音声生成 / TTS

GitHub

LightTTS

LightTTSは、Pythonベースの軽量かつ高性能なテキスト読み上げ（TTS）推論・サービスフレームワークです。CosyVoice2…

#CLI #Docker #GPU必須

★ 46 ⑂ 7 Apache-2.0 2026-04-14

3D / NeRF

GitHub

gaussiancar

GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…

#Docker #GPU必須 #Python

★ 46 ⑂ 2 Apache-2.0 2026-05-07

画像生成

GitHub

gpic

GPIC（Giant Permissive Image Corpus）は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…

#GPU必須 #Hugging Face #Python

★ 46 ⑂ 1 MIT 2026-06-04

画像生成

GitHub

MagicBokeh

MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…

#CLI #GPU必須 #Python

★ 46 ⑂ 1 2026-06-17

画像生成

GitHub

Fizgig

Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…

#ComfyUI対応 #GPU必須 #Linux対応

★ 46 ⑂ 3 Apache-2.0 2026-06-07

音声生成 / TTS

GitHub

Audio-Oscar

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…

#CLI #FFmpeg #GPU必須

★ 42 ⑂ 4 Apache-2.0 2026-06-08

LLM

GitHub

ThinkJEPA

ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…

#CLI #GPU必須 #Hugging Face

★ 42 ⑂ 5 NOASSERTION 2026-04-30

画像生成

GitHub

Coarse-guided-Gen

「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…

#CLI #GPU必須 #Python

★ 42 ⑂ 4 2026-05-08

音楽生成

GitHub

studiomi300

studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…

#AMD Instinct MI300X #CLI #GPU必須

★ 42 ⑂ 8 MIT 2026-05-22

音声生成 / TTS

GitHub

Irodori-TTS-Server

「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…

#Docker #GPU必須 #OpenAI API Compatible

★ 41 ⑂ 10 MIT 2026-06-22

LLM

GitHub

bit-brain

BitBrainは、最小限のGPUリソース（RTX 3090以上）で独自の小型LLM（miniLLM）を学習できるプロジェクトです。Qwen3-…

#CLI #GPU必須 #LLM

★ 41 ⑂ 2 Apache-2.0 2026-05-04

3D / NeRF

GitHub

OVGGT

OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…

#3D再構成 #CLI #GPU必須

★ 41 ⑂ 1 NOASSERTION 2026-06-15

3D / NeRF

GitHub

vggt-factor-refinement

このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT（Video-based General-purpose Geome…

#3D再構築 #CLI #COLMAP形式出力

★ 38 ⑂ 2 2026-06-16

マルチモーダル

GitHub

VL-Calibration

VL-Calibrationは、大規模視覚言語モデル（LVLMs）の推論における信頼性キャリブレーションを向上させるためのフレー…

#CLI #GPU必須 #Python

★ 37 Apache-2.0 2026-04-13

画像生成

GitHub

colored-noise-sampling

Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…

#CLI #GPU必須 #Python

★ 37 ⑂ 3 MIT 2026-06-01

LLM

GitHub

spark-evals

このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…

#AI/機械学習 #GPU必須 #Python

★ 36 ⑂ 1 2026-06-21

動画生成

GitHub

Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention

LIVEditor-14Bは、文脈に即したスパースアテンション（In-Context Sparse Attention）を活用することで、動画編集に…

#CLI #GPU必須 #Hugging Face

★ 34 2026-05-15

LLM

GitHub

TimeOmni-1

TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…

#GPU必須 #Hugging Face #LLM

★ 34 ⑂ 3 Apache-2.0 2026-06-12

3D / NeRF

GitHub

TRELLIS-AMD

このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU（特にROCm対応モデル）で動作するように修…

#AMD GPU対応 #CLI #GPU必須

★ 33 ⑂ 3 MIT 2026-05-09

動画生成

GitHub

seedance-api

Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…

#CLI #GPU必須 #Python

★ 33 ⑂ 5 2026-06-24

画像生成

GitHub

RTDMD

RTDMD（Reward-Tilted Distribution Matching Distillation）は、少ないステップ数で高品質な画像を生成する「few-st…

#CLI #GPU必須 #Python

★ 32 ⑂ 1 Apache-2.0 2026-06-06

マルチモーダル

GitHub

Uni-ViGU

Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…

#CLI #Diffusionモデル #GPU必須

★ 32 ⑂ 1 Apache-2.0 2026-04-15