3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

YanXi-KCN

Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…

#CLI #GPU必須 #Python

★ 2 2026-05-29

3D / NeRF

GitHub

maya-gaussian-splatting-viewport-plugin

本ツールは、Autodesk Maya Viewport 2.0内でリアルタイム3D Gaussian Splatting（.plyファイル）レンダリングを可能…

#C++ #GPU必須 #Maya対応

★ 2 MIT 2026-05-28

音声生成 / TTS

GitHub

GPT-SoVITS-ko

このツールは、韓国語に特化した音声複製TTS（Text-to-Speech）サービスです。既存のGPT-SoVITSプロジェクトを基盤と…

#CLI #Docker #GPU必須

★ 2 ⑂ 1 MIT 2026-05-27

LLM

GitHub

Auralis

Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」（Mamba-2/GLA/Sparse-Attentionベース）を利用した…

#CLI #GPU必須 #LLM開発

★ 2 Apache-2.0 2026-06-19

画像生成

GitHub

diffusion

本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…

#AI/機械学習 #CelebA #GPU必須

★ 2 2026-06-10

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

画像生成

GitHub

ReCo-Diff

ReCo-Diffは、スパースビューCT（低線量CT）における画像再構成のための、残差条件付き決定論的サンプリングに基づく…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-15

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

ComfyUI

GitHub

semcanvas-ai

SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-05-13

画像生成

GitHub

SwiftDiffusion

SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…

#GPU必須 #GUI #Linux対応

★ 2 ⑂ 1 MIT 2026-06-11

音声生成 / TTS

GitHub

strands-omnivoice

strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-16

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

画像生成

GitHub

hermes-image-local-tools

この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-06-03

画像生成

GitHub

rainfield-diffusion-models

本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…

#CLI #GPU必須 #Python

★ 2 NOASSERTION 2026-05-21

音楽生成

GitHub

anvil-audio-v2

Anvil Audioは、Stability AIの`stable-audio-tools`を拡張し、AIオーディオ生成のためのプラグイン可能なスタジオツ…

#AI Audio Generation #Apple Silicon対応 #CLI

★ 2 MIT 2026-06-12

画像生成

GitHub

sage-color

SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…

#CLI #GPU必須 #Hugging Face

★ 2 NOASSERTION 2026-05-28

動画生成

GitHub

making-commercials-with-ltx-ai-video-guide

「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…

#AIビデオ生成 #CLI #ComfyUI対応

★ 2 Apache-2.0 2026-04-29

動画生成

GitHub

sanatation

NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…

#Apple Silicon #CLI #GPU必須

★ 2 Apache-2.0 2026-05-21

ASR / 音声認識

GitHub

deckle

Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…

#.NET #CLI #GPU必須

★ 2 MIT 2026-06-16

その他

GitHub

Neural-Zero-Shot-Voice-Cloning

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…

#Docker #GPU必須 #Python

★ 2 MIT 2026-06-11

ASR / 音声認識

GitHub

IndiVoice-DeepASR

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA（Low-Rank Adaptation）技術でファインチューニングすることによ…

#GPU必須 #Gradio #LoRA / PEFT

★ 2 MIT 2026-06-22

マルチモーダル

GitHub

kmetbench-release

K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-24

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 2 ⑂ 1 MIT 2026-06-14

ComfyUI

GitHub

LoRA-Gallery-Loader—Custom-Node

「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA（Low-R…

#ComfyUI対応 #GPU必須 #Python

★ 2 ⑂ 1 2026-04-18