3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
2D-X-ray-to-3D-Bone-Reconstruction
このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…
★ 1 2026-06-15
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
動画生成
GitHub
HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
3D / NeRF
GitHub
gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ComfyUI
GitHub
comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
音声生成 / TTS
GitHub
voxcpm2-pinokio-launcher
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…
★ 1 2026-05-03
3D / NeRF
GitHub
TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
LLM
GitHub
Project-adam-v2
Synthesizer V2(Project Adam V2)は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…
★ 1 MIT 2026-05-22
3D / NeRF
GitHub
Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems
このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…
★ 1 2026-05-26
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
画像生成
GitHub
vision-studio
Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…
★ 1 MIT 2026-06-21
音声生成 / TTS
GitHub
Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
マルチモーダル
GitHub
-deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
マルチモーダル
GitHub
obsidian-neural-central
OBSIDIAN Neuralは、音楽制作者向けのリアルタイムAI音楽生成サーバーで、OBSIDIAN Neural VSTプラグインと連携しま…
★ 1 AGPL-3.0 2026-06-24
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
マルチモーダル
GitHub
uitars-mcp
UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…
★ 1 Apache-2.0 2026-06-07
動画生成
GitHub
mefaihomevideoai
MEFAI Home Video AIは、画像から動画を生成するエンドツーエンドのAIパイプラインです。高価なGPUをレンタルするこ…
★ 1 Apache-2.0 2026-06-25
3D / NeRF
GitHub
hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
3D / NeRF
GitHub
OptixGaussianRenderer
「OptixGaussianRenderer」は、NVIDIA OptiXフレームワークを用いてGaussian Splatsのレイトレーシングを実装したプ…
★ 1 GPL-3.0 2026-04-04
3D / NeRF
GitHub
NeRF.cpp
NeRF.cppは、C++とLibTorchを用いてNeRF(Neural Radiance Fields)を実装したツールです。静止したシーンのRGB画像…
★ 1 BSD-3-Clause 2026-05-17
マルチモーダル
GitHub
PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
画像生成
GitHub
Brain-MRI-Generation-and-Segmentation
このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…
★ 1 2026-06-09
音声生成 / TTS
GitHub
lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10