3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
画像生成 GitHub PiD-Image-Upscaler
PiD-Image-Upscalerは、NVIDIAのPiD(Pixel Diffusion Decoder)フレームワークを基盤とした、実験的な高機能超解像…
★ 6 ⑂ 2 Apache-2.0 2026-06-14
動画生成 GitHub Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
画像生成 GitHub spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
画像生成 GitHub dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
画像生成 GitHub lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 6 MIT 2026-05-22
ComfyUI GitHub neuralforge
NeuralForgeは、ローカル環境で動作する自己ホスト型AI統合ダッシュボードです。LLMの管理、複数プラットフォームで…
★ 6 ⑂ 1 MIT 2026-03-26
3D / NeRF GitHub LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
音声生成 / TTS GitHub HiggsAudiov2TokenizerUnofficial
本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。960倍ダウン…
★ 6 ⑂ 2 2025-10-08
3D / NeRF GitHub higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
音声生成 / TTS GitHub kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
3D / NeRF GitHub Kestrel
Kestrelは、ロボティクスおよびシミュレーションパイプライン向けのリアルタイム2D Gaussian Splattingビューアです…
★ 5 2026-06-05
画像生成 GitHub nitograph
Nitographは、MNISTの数字をネオン風のストリングアートに変換し、釘から釘への連続的な糸の経路を生成するクラス条…
★ 5 2026-06-12
画像生成 GitHub ai-toolkit-Ostris-bonememory
AI-Toolkit向けの「Viking Engine」は、非同期CUDAメモリマネージャーとbf16精度強制により、LoRA学習におけるVRAMの…
★ 5 MIT 2026-06-24
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
音声生成 / TTS GitHub VoxFlashTTS
VoxFlash-TTSは、リアルタイム推論に特化した業界最速の音声クローンシステムです。ゼロショット学習により、事前学…
★ 5 2026-06-21
動画生成 GitHub wan2gp-operator
Wan2GP Operatorは、WanGP/Wan2GPによるテキストからビデオ生成を効率化・自動化するオープンソースのCLIツールです…
★ 5 MIT 2026-05-11