3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
ComfyUI GitHub Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
マルチモーダル GitHub SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
画像生成 GitHub comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
画像生成 GitHub mold
moldは、ローカルGPUを活用して画像や短いビデオクリップを生成する強力なCLIツールです。クラウドやPython環境を必…
★ 27 MIT 2026-06-22
3D / NeRF GitHub QuestRoomScan
QuestRoomScanは、Meta Quest 3向けのリアルタイム3Dルーム再構築ツールです。GPU TSDFとSurface Netsメッシュ抽出を…
★ 27 ⑂ 2 NOASSERTION 2026-04-20
画像生成 GitHub ComfyUI-HiresFix-Ultra-AllInOne
ComfyUI Hires Fix Ultra - All in Oneは、ComfyUI向けの高性能なHires Fixソリューションです。潜在空間/モデルアッ…
★ 26 ⑂ 2 MIT 2026-04-06
マルチモーダル GitHub EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
音声生成 / TTS GitHub mlx-speech
mlx-speechは、Apple Silicon Mac(M1以降)向けに特化した、純粋なMLXベースの音声技術ツールキットです。クラウド…
★ 26 ⑂ 4 MIT 2026-06-24
画像生成 GitHub modl
modlは、ローカル環境でAI画像生成とLoRA学習を行うためのツールキットです。モデルのダウンロードから依存関係の解…
★ 25 ⑂ 2 AGPL-3.0 2026-05-06
音声生成 / TTS GitHub silma-tts
SILMA Arabic TTS v1は、SILMA AIによって開発された軽量かつ高性能なバイリンガル(アラビア語と英語)テキスト音声…
★ 25 ⑂ 4 MIT 2026-05-07
画像生成 GitHub ChaosEngineAI
ChaosEngineAIは、本格的なAI開発者や愛好家向けのローカルAIワークステーションです。オープンウェイトモデルの発見…
★ 25 ⑂ 4 Apache-2.0 2026-06-26
動画生成 GitHub comfyui-wan-i2v-control
ComfyUI WAN I2V Controlは、WAN Image-to-Video生成において、開始画像の特定の部分を選択的に変換するためのComfyU…
★ 25 ⑂ 1 2026-06-07
マルチモーダル GitHub MOSAIC
MOSAICは、強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)、そして人間の意思決定者といった異な…
★ 24 ⑂ 4 MIT 2026-04-21
3D / NeRF GitHub EAG-PT
EAG-PTは、SIGGRAPH 2026で発表された、屋内の拡散反射シーンの再構築と編集を行うための研究プロジェクトです。Emis…
★ 24 ⑂ 4 MIT 2026-05-22
ComfyUI GitHub ComfyUI-Sapiens2-Easy
「ComfyUI-Sapiens2-Easy」は、Meta Sapiens2モデルをComfyUIのネイティブノードとして統合するツールです。単一の画…
★ 24 ⑂ 2 NOASSERTION 2026-05-04
3D / NeRF GitHub varsplat
VarSplatは、不確実性認識型の3D Gaussian Splattingを基盤とした堅牢なRGB-D SLAMシステムです。個々のスプラットの…
★ 24 MIT 2026-06-14
画像生成 GitHub JustRayzist
JustRayzistは、Rayzist Z-Image Turboファインチューンを中心に構築された軽量なCUDAベースのローカル画像生成プラ…
★ 23 ⑂ 1 Apache-2.0 2026-05-19
動画生成 GitHub Helios-Page
Heliosは、リアルタイムで長尺の動画を生成する革新的なモデルです。140億パラメータという大規模モデルでありながら…
★ 22 ⑂ 2 2026-05-30
マルチモーダル GitHub ETCHR
ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。マルチ…
★ 22 NOASSERTION 2026-05-25
ComfyUI GitHub ComfyUI-LongCat-Avatar
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆…
★ 22 ⑂ 2 MIT 2026-06-15