3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (831 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
音楽生成
GitHub
aeon-music-maker
aeon-music-makerは、テキスト記述からスタジオ品質の音楽を生成するCLIツールです。ACE Step 1.5 XLモデルを活用し…
★ 3 MIT 2026-07-01
音声生成 / TTS
GitHub
supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
マルチモーダル
GitHub
reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-21
ComfyUI
GitHub
ComfyUI-zveroboy-photo
ComfyUI-zveroboy-photoは、AI生成画像にリアルなセンサーノイズ、アナログアーティファクト、カメラメタデータを適…
★ 3 2026-06-29
画像生成
GitHub
ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 3 ⑂ 1 MIT 2026-05-22
音声生成 / TTS
GitHub
AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
動画生成
GitHub
bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
ComfyUI
GitHub
ai-cinema-studio-engine
PopTech Studioが提供するAI Cinema Studio Engineは、自社ホスト型のAI映画制作エンジンです。Higgsfield Cinema St…
★ 3 ⑂ 2 MIT 2026-04-13
画像生成
GitHub
SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
3D / NeRF
GitHub
m3d_rocm
このプロジェクトは、Matrix-3DをAMDのROCmエコシステム向けに最適化した3D世界生成ツールです。テキストまたは画像…
★ 3 MIT 2026-06-19
ComfyUI
GitHub
gpus-python-example
このリポジトリは、Novita GPUs SDKを使用してPythonワーカーハンドラを実装する方法を示すための具体例を提供します…
★ 2 Apache-2.0 2026-05-28
マルチモーダル
GitHub
video-evaluator
「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…
★ 2 MIT 2026-06-25
画像生成
GitHub
mythforgemtg
Myth Forgeは、単一のテーマプロンプトから、AIが生成したカスタムカードアートとプロキシフレームを用いて、テーマ…
★ 2 ⑂ 1 2026-06-18
マルチモーダル
GitHub
multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
音声生成 / TTS
GitHub
NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-06-25
音楽生成
GitHub
melody-engine
Melody Engineは、プロンプトに基づいてインストゥルメンタル音楽を生成するツールです。GoogleのMagentaRTを薄くラ…
★ 2 Apache-2.0 2026-06-09
3D / NeRF
GitHub
prml-vslam
このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…
★ 2 MIT 2026-06-26
画像生成
GitHub
adafactor-8bit
このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…
★ 2 MIT 2026-06-24
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 2 ⑂ 1 MIT 2026-04-17
音声生成 / TTS
GitHub
Python-Autodub
Python Autodubは、AIを活用した自動動画吹き替えパイプラインです。音声抽出、Demucsによるボーカル分離、DiariZen…
★ 2 ⑂ 2 MPL-2.0 2026-06-03
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04