3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
画像生成
GitHub
reel-forge
reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…
★ 1 ⑂ 5 MIT 2026-05-19
ASR / 音声認識
GitHub
funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
動画生成
GitHub
swift-render
swift-renderは、SwiftUIとMetalシェーダーを用いてプログラムでモーショングラフィックスを生成し、MP4に出力するma…
★ 1 MIT 2026-06-15
3D / NeRF
GitHub
DNP-3DDMR-IR
本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…
★ 1 2026-06-23
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
3D / NeRF
GitHub
2D-X-ray-to-3D-Bone-Reconstruction
このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…
★ 1 2026-06-15
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
動画生成
GitHub
HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
3D / NeRF
GitHub
gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ComfyUI
GitHub
comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
音声生成 / TTS
GitHub
voxcpm2-pinokio-launcher
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…
★ 1 2026-05-03
3D / NeRF
GitHub
TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
LLM
GitHub
Project-adam-v2
Synthesizer V2(Project Adam V2)は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…
★ 1 MIT 2026-05-22
3D / NeRF
GitHub
Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems
このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…
★ 1 2026-05-26
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
画像生成
GitHub
vision-studio
Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…
★ 1 MIT 2026-06-21
音声生成 / TTS
GitHub
Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
マルチモーダル
GitHub
-deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
マルチモーダル
GitHub
obsidian-neural-central
OBSIDIAN Neuralは、音楽制作者向けのリアルタイムAI音楽生成サーバーで、OBSIDIAN Neural VSTプラグインと連携しま…
★ 1 AGPL-3.0 2026-06-24
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
マルチモーダル
GitHub
uitars-mcp
UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…
★ 1 Apache-2.0 2026-06-07