3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (831 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
マルチモーダル GitHub tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
マルチモーダル GitHub local-asset-gen-mcp
このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…
★ 1 GPL-3.0 2026-03-28
音楽生成 GitHub MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
3D / NeRF GitHub Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems
このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…
★ 1 2026-05-26
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
マルチモーダル GitHub fal-ai
fal (fal-ai) は、画像、動画、音声、マルチモーダルな生成AIモデルを超高速で実行できるAPIを提供する生成メディア…
★ 1 2026-06-20
マルチモーダル GitHub vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
3D / NeRF GitHub Lid-Lab-NeRF
Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…
★ 1 Apache-2.0 2025-11-28
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
画像生成 GitHub EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
3D / NeRF GitHub Cosmo3DFlow
Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…
★ 1 MIT 2026-06-12
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
3D / NeRF GitHub faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
3D / NeRF GitHub 2D-X-ray-to-3D-Bone-Reconstruction
このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…
★ 1 2026-06-15
音声生成 / TTS GitHub KuRL
KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…
★ 1 MIT 2026-02-13
3D / NeRF GitHub Forma-3D-Vision-Engine
Formaは、標準的な2D写真を高密度なカラー3Dメッシュに変換するコンピュータビジョンエンジンです。特殊なカメラやハ…
★ 1 2026-03-24
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
LLM GitHub l40s-llm-bench
本ツールは、NVIDIA L40SなどのシングルGPU環境で再現可能なLLM推論ベンチマーク実験を行うための最小限の足場を提供…
★ 1 ⑂ 1 MIT 2026-06-10
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
3D / NeRF GitHub hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
画像生成 GitHub ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14