3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU推奨 (101 repos)

「GPU推奨」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
LLMs-from-scratch
このリポジトリは、書籍「Build a Large Language Model (From Scratch)」の公式コードベースです。GPTに似た大規模…
★ 98.0k ⑂ 15.0k NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
voicebox
Voiceboxは、ElevenLabsやWisprFlowの機能を統合した、オープンソースのAI音声スタジオです。数秒の音声サンプルから…
★ 35.2k ⑂ 4.2k MIT 2026-06-28
画像生成
GitHub
InvokeAI
Invokeは、Stable Diffusionモデルを活用し、プロフェッショナルから愛好家まで幅広いユーザーがビジュアルメディア…
★ 27.5k ⑂ 2.9k Apache-2.0 2026-06-29
音声生成 / TTS
GitHub
index-tts
IndexTTS2は、感情豊かで再生時間の厳密な制御が可能な自己回帰型ゼロショットテキスト音声合成(TTS)モデルです。…
★ 21.4k ⑂ 2.6k NOASSERTION 2026-06-23
3D / NeRF
GitHub
Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-06-27
マルチモーダル
GitHub
X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.6k ⑂ 1.0k GPL-3.0 2026-06-28
ASR / 音声認識
GitHub
inference
Xorbits Inference (Xinference) は、言語、音声認識、マルチモーダルモデルの提供を容易にする強力で多機能なライブ…
★ 9.4k ⑂ 837 Apache-2.0 2026-06-24
音声生成 / TTS
GitHub
Bert-VITS2
Bert-VITS2は、多言語BERTをVITS2バックボーンに統合したテキスト読み上げ(TTS)システムです。このツールは、高度…
★ 8.8k ⑂ 1.3k AGPL-3.0 2026-06-22
LLM
GitHub
how-to-train-your-gpt
このリポジリは、ChatGPTなどに使われている大規模言語モデル(LLM)をゼロから構築、学習、実行する方法を学ぶため…
★ 2.3k ⑂ 303 MIT 2026-06-23
ComfyUI
GitHub
comfyui-mixlab-nodes
comfyui-mixlab-nodesは、ComfyUI向けにWebアプリ化、画面共有、音声認識・音声合成、GPT連携、3D生成などをまとめて…
★ 1.9k ⑂ 125 MIT 2026-06-04
ComfyUI
GitHub
ComfyUI-ReActor
ComfyUI向けの高速・簡単な顔交換ノード集で、画像内の顔を別の顔へ差し替えるワークフローをWeb UI上で構築できます…
★ 1.3k ⑂ 231 GPL-3.0 2026-05-12
ComfyUI
GitHub
audio-separation-nodes-comfyui
このツールは、ComfyUI内で動作するカスタムノード集です。音声からボーカル、ベース、ドラム、その他の楽器といった…
★ 582 ⑂ 56 MIT 2026-04-14
ComfyUI
GitHub
ComfyUI-DepthAnythingV3
ComfyUI上でDepth Anything V3を使えるようにするカスタムノード集です。単一画像や複数視点画像から深度推定を行い…
★ 422 ⑂ 29 MIT 2026-06-06
画像生成
GitHub
DISCO
DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…
★ 203 ⑂ 24 Apache-2.0 2026-05-13
ComfyUI
GitHub
ComfyUI-Lux3D
ComfyUI-Lux3Dは、2D画像から3Dモデルを生成し、ComfyUIワークフロー内でリアルタイムレンダリング、シーンテンプレ…
★ 110 ⑂ 3 MIT 2026-05-14
動画生成
GitHub
open-director
OpenDirectorは、一行のアイデアから音声、BGM、絵コンテ付きの完成されたビデオを生成するオープンソースのAIビデオ…
★ 61 ⑂ 12 LGPL-3.0 2026-05-29
音声生成 / TTS
GitHub
Higgs_v3-TTS-ComfyUI
このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語(100言語対応)…
★ 43 ⑂ 8 MIT 2026-06-20
ComfyUI
GitHub
ComfyUI-Grounding
ComfyUI-Groundingは、ComfyUI上でテキスト指定による物体検出・領域マスク生成・SAM2セグメンテーションをまとめて…
★ 41 ⑂ 3 MIT 2026-06-22
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
3D / NeRF
GitHub
gaussian-splatting-studio
「3DGS Studio」は、ブラウザ上で動作する軽量な3D Gaussian Splatting(3DGS)作業環境です。ローカルの3DGSモデル…
★ 21 ⑂ 1 MIT 2026-04-26
ASR / 音声認識
GitHub
AI-Medical-Scribe
AI Medical Scribeは、ブラウザ内で完結するローカルファーストのAI医療記録ツールです。バックエンドやAPIキーが不…
★ 13 ⑂ 1 MIT 2026-05-22
LLM
GitHub
tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
音声生成 / TTS
GitHub
ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16