3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

video-evaluator

「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…

#GPU必須 #GUI #Windows

★ 2 MIT 2026-06-25

画像生成

GitHub

mythforgemtg

Myth Forgeは、単一のテーマプロンプトから、AIが生成したカスタムカードアートとプロキシフレームを用いて、テーマ…

#ComfyUI対応 #FastAPI #GPU必須

★ 2 ⑂ 1 2026-06-18

マルチモーダル

GitHub

multimodal-music-genre-classifier

このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…

#CLI #GPU必須 #Jupyter Notebook

★ 2 MIT 2026-05-13

LLM

GitHub

drm_transformer

DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…

#GPU必須 #Python #PyTorch

★ 2 NOASSERTION 2026-06-17

音声生成 / TTS

GitHub

NeuralForge

NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル（LLM）をファインチューニングするためのツー…

#GGUF #GPU必須 #QLoRA

★ 2 MIT 2026-06-25

音楽生成

GitHub

melody-engine

Melody Engineは、プロンプトに基づいてインストゥルメンタル音楽を生成するツールです。GoogleのMagentaRTを薄くラ…

#CLI #Docker/Podman #GPU必須

★ 2 Apache-2.0 2026-06-09

3D / NeRF

GitHub

prml-vslam

このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-26

画像生成

GitHub

adafactor-8bit

このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…

#CLI #GPU必須 #JITコンパイル

★ 2 MIT 2026-06-24

LLM

GitHub

megatrain-guide-cn

MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…

#CLI #GPU必須 #LLM

★ 2 ⑂ 1 MIT 2026-04-17

音声生成 / TTS

GitHub

Python-Autodub

Python Autodubは、AIを活用した自動動画吹き替えパイプラインです。音声抽出、Demucsによるボーカル分離、DiariZen…

#CLI #GPU必須 #GUI

★ 2 ⑂ 2 MPL-2.0 2026-06-03

画像生成

GitHub

DiffVMB-pub

本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 2026-05-04

ASR / 音声認識

GitHub

YanXi-KCN

Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…

#CLI #GPU必須 #Python

★ 2 2026-05-29

3D / NeRF

GitHub

maya-gaussian-splatting-viewport-plugin

本ツールは、Autodesk Maya Viewport 2.0内でリアルタイム3D Gaussian Splatting（.plyファイル）レンダリングを可能…

#C++ #GPU必須 #Maya対応

★ 2 MIT 2026-05-28

音声生成 / TTS

GitHub

GPT-SoVITS-ko

このツールは、韓国語に特化した音声複製TTS（Text-to-Speech）サービスです。既存のGPT-SoVITSプロジェクトを基盤と…

#CLI #Docker #GPU必須

★ 2 ⑂ 1 MIT 2026-05-27

LLM

GitHub

Auralis

Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」（Mamba-2/GLA/Sparse-Attentionベース）を利用した…

#CLI #GPU必須 #LLM開発

★ 2 Apache-2.0 2026-06-19

画像生成

GitHub

diffusion

本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…

#AI/機械学習 #CelebA #GPU必須

★ 2 2026-06-10

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

画像生成

GitHub

ReCo-Diff

ReCo-Diffは、スパースビューCT（低線量CT）における画像再構成のための、残差条件付き決定論的サンプリングに基づく…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-15

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

ComfyUI

GitHub

semcanvas-ai

SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-05-13

画像生成

GitHub

SwiftDiffusion

SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…

#GPU必須 #GUI #Linux対応

★ 2 ⑂ 1 MIT 2026-06-11

音声生成 / TTS

GitHub

strands-omnivoice

strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-16

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

画像生成

GitHub

hermes-image-local-tools

この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-06-03