3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
3D / NeRF
GitHub
maya-gaussian-splatting-viewport-plugin
本ツールは、Autodesk Maya Viewport 2.0内でリアルタイム3D Gaussian Splatting(.plyファイル)レンダリングを可能…
★ 2 MIT 2026-05-28
音声生成 / TTS
GitHub
GPT-SoVITS-ko
このツールは、韓国語に特化した音声複製TTS(Text-to-Speech)サービスです。既存のGPT-SoVITSプロジェクトを基盤と…
★ 2 ⑂ 1 MIT 2026-05-27
LLM
GitHub
Auralis
Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」(Mamba-2/GLA/Sparse-Attentionベース)を利用した…
★ 2 Apache-2.0 2026-06-19
画像生成
GitHub
diffusion
本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…
★ 2 2026-06-10
画像生成
GitHub
FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
画像生成
GitHub
ReCo-Diff
ReCo-Diffは、スパースビューCT(低線量CT)における画像再構成のための、残差条件付き決定論的サンプリングに基づく…
★ 2 MIT 2026-06-15
音声生成 / TTS
GitHub
Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
ComfyUI
GitHub
semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
画像生成
GitHub
SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
音声生成 / TTS
GitHub
strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
マルチモーダル
GitHub
visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
画像生成
GitHub
hermes-image-local-tools
この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…
★ 2 MIT 2026-06-03
画像生成
GitHub
rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
音楽生成
GitHub
anvil-audio-v2
Anvil Audioは、Stability AIの`stable-audio-tools`を拡張し、AIオーディオ生成のためのプラグイン可能なスタジオツ…
★ 2 MIT 2026-06-12
画像生成
GitHub
sage-color
SAGE-Colorは、参照画像の色、トーン、コントラスト、領域レベルの外観をコンテンツ画像に転送する、参照ベースのカ…
★ 2 NOASSERTION 2026-05-28
動画生成
GitHub
making-commercials-with-ltx-ai-video-guide
「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…
★ 2 Apache-2.0 2026-04-29
動画生成
GitHub
sanatation
NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…
★ 2 Apache-2.0 2026-05-21
ASR / 音声認識
GitHub
deckle
Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…
★ 2 MIT 2026-06-16
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
ASR / 音声認識
GitHub
IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
マルチモーダル
GitHub
kmetbench-release
K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…
★ 2 MIT 2026-06-24
音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
ComfyUI
GitHub
LoRA-Gallery-Loader—Custom-Node
「LoRA Gallery Node for ComfyUI」は、画像生成AIツールComfyUI用のカスタムノードです。このツールは、LoRA(Low-R…
★ 2 ⑂ 1 2026-04-18