3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
ora
Oraは、macOS向けのリアルタイムローカル音声翻訳アプリケーションです。Apple Silicon Mac上で動作し、全ての処理を…
★ 48 ⑂ 4 MIT 2026-06-04
ComfyUI
GitHub
ComfyUI-YCNodes
ComfyUI-YCNodesは、人気の画像生成Web UI「ComfyUI」向けに特化した画像処理拡張ノード集です。画像ミラー、回転、…
★ 46 ⑂ 2 MIT 2026-05-09
音声生成 / TTS
GitHub
LightTTS
LightTTSは、Pythonベースの軽量かつ高性能なテキスト読み上げ(TTS)推論・サービスフレームワークです。CosyVoice2…
★ 46 ⑂ 7 Apache-2.0 2026-04-14
3D / NeRF
GitHub
gaussiancar
GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…
★ 46 ⑂ 2 Apache-2.0 2026-05-07
画像生成
GitHub
gpic
GPIC(Giant Permissive Image Corpus)は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…
★ 46 ⑂ 1 MIT 2026-06-04
画像生成
GitHub
MagicBokeh
MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…
★ 46 ⑂ 1 2026-06-17
画像生成
GitHub
Fizgig
Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…
★ 46 ⑂ 3 Apache-2.0 2026-06-07
音声生成 / TTS
GitHub
Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 42 ⑂ 4 Apache-2.0 2026-06-08
LLM
GitHub
ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30
画像生成
GitHub
Coarse-guided-Gen
「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…
★ 42 ⑂ 4 2026-05-08
音楽生成
GitHub
studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 42 ⑂ 8 MIT 2026-05-22
音声生成 / TTS
GitHub
Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 41 ⑂ 10 MIT 2026-06-22
LLM
GitHub
bit-brain
BitBrainは、最小限のGPUリソース(RTX 3090以上)で独自の小型LLM(miniLLM)を学習できるプロジェクトです。Qwen3-…
★ 41 ⑂ 2 Apache-2.0 2026-05-04
3D / NeRF
GitHub
OVGGT
OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…
★ 41 ⑂ 1 NOASSERTION 2026-06-15
3D / NeRF
GitHub
vggt-factor-refinement
このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT(Video-based General-purpose Geome…
★ 38 ⑂ 2 2026-06-16
マルチモーダル
GitHub
VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
LLM
GitHub
spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
3D / NeRF
GitHub
TRELLIS-AMD
このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU(特にROCm対応モデル)で動作するように修…
★ 33 ⑂ 3 MIT 2026-05-09
動画生成
GitHub
seedance-api
Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…
★ 33 ⑂ 5 2026-06-24
画像生成
GitHub
RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
マルチモーダル
GitHub
Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15