3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
ComfyUI
GitHub
WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
動画生成
GitHub
ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
画像生成
GitHub
ScribeNEO
ScribeNEOは、Stable Diffusion Forge Neo専用に開発されたプロンプトエンジニアリング拡張機能です。AIを活用し、ユ…
★ 6 MIT 2026-05-29
音声生成 / TTS
GitHub
vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS
GitHub
the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
画像生成
GitHub
kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
音声生成 / TTS
GitHub
uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
画像生成
GitHub
PiD-Image-Upscaler
PiD-Image-Upscalerは、NVIDIAのPiD(Pixel Diffusion Decoder)フレームワークを基盤とした、実験的な高機能超解像…
★ 6 ⑂ 2 Apache-2.0 2026-06-14
動画生成
GitHub
Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
画像生成
GitHub
spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
画像生成
GitHub
M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
画像生成
GitHub
dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
画像生成
GitHub
lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 6 MIT 2026-05-22
画像生成
GitHub
CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
LLM
GitHub
spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
動画生成
GitHub
wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
ASR / 音声認識
GitHub
whisperx-transcriber
WhisperX Transcriberは、Windowsユーザー向けのオフラインAI音声文字変換ツールです。OpenAIのWhisperモデルとWhisp…
★ 5 ⑂ 1 MIT 2026-06-09
画像生成
GitHub
reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
3D / NeRF
GitHub
Kestrel
Kestrelは、ロボティクスおよびシミュレーションパイプライン向けのリアルタイム2D Gaussian Splattingビューアです…
★ 5 2026-06-05
画像生成
GitHub
nitograph
Nitographは、MNISTの数字をネオン風のストリングアートに変換し、釘から釘への連続的な糸の経路を生成するクラス条…
★ 5 2026-06-12