3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU必須 (833 repos)

「GPU必須」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

FootPrint

FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…

#CLI #GPU必須 #OpenCV

★ 1 MIT 2026-05-18

画像生成

GitHub

reel-forge

reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…

#AI #AWS #CLI

★ 1 ⑂ 5 MIT 2026-05-19

ASR / 音声認識

GitHub

funasr-whisper-api

このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…

#CLI #GPU必須 #OpenAI Whisper API互換

★ 1 MIT 2026-06-14

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

動画生成

GitHub

swift-render

swift-renderは、SwiftUIとMetalシェーダーを用いてプログラムでモーショングラフィックスを生成し、MP4に出力するma…

#CLI #GPU必須 #macOS 14+

★ 1 MIT 2026-06-15

3D / NeRF

GitHub

DNP-3DDMR-IR

本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…

#GPU必須 #Jupyter Notebook #Python

★ 1 2026-06-23

マルチモーダル

GitHub

MultiModal-from-scratch

このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル（VLM）をゼロから構築するための詳細なステップ…

#CLI #GPU必須 #Python

★ 1 2026-06-06

3D / NeRF

GitHub

2D-X-ray-to-3D-Bone-Reconstruction

このAIツールは、標準的な2D X線画像から3D骨格構造を高精度に再構築します。ConvNeXtエンコーダとニューラルインプ…

#AI #CLI #GPU必須

★ 1 2026-06-15

ComfyUI

GitHub

ComfyUI-Selective-Sigma-Detailer

ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…

#AI/機械学習 #ComfyUIカスタムノード #GPU必須

★ 1 ⑂ 3 MIT 2026-05-10

動画生成

GitHub

HappyHorse-1.0

Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…

#AIビデオ生成 #GPU必須 #Python

★ 1 2026-04-11

3D / NeRF

GitHub

gsplat-mlx

gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…

#Apple Silicon #C++ #CLI

★ 1 MIT 2026-06-25

ComfyUI

GitHub

comfyui-Colab

このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…

#ComfyUI対応 #Google Colab #GPU必須

★ 1 ⑂ 1 2026-06-06

音声生成 / TTS

GitHub

voxcpm2-pinokio-launcher

このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…

#GPU必須 #HTTP API #Pinokio

★ 1 2026-05-03

3D / NeRF

GitHub

TripoSplat

TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…

#3Dモデル生成 #GPU必須 #Windows対応

★ 1 MIT 2026-06-26

ASR / 音声認識

GitHub

The-Earful-Tower

「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…

#GPU必須 #Python #Windowsのみ

★ 1 MIT 2026-06-13

LLM

GitHub

Project-adam-v2

Synthesizer V2（Project Adam V2）は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…

#Google Colab #GPU必須 #Jupyter Notebook

★ 1 MIT 2026-05-22

3D / NeRF

GitHub

Multi-View-Fusion-Object-Detection-for-underwater-robotic-systems

このプロジェクトは、ROS2とYOLOv8を用いたリアルタイムの多視点融合オブジェクト検出システムです。複数のカメラか…

#3D検出 #CLI #GPU必須

★ 1 2026-05-26

3D / NeRF

GitHub

project_slam_gs3lam

GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM（…

#CLI #GPU必須 #Python

★ 1 2026-04-04

画像生成

GitHub

vision-studio

Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…

#ComfyUI対応 #GPU必須 #Python

★ 1 MIT 2026-06-21

音声生成 / TTS

GitHub

Cadence

Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…

#GPU必須 #Python (内部利用) #Windows 10/11

★ 1 MIT 2026-06-16

マルチモーダル

GitHub

-deepseek-skills

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（…

#AI Skills 套装 #CLI #GPU必須

★ 1 2026-06-04

マルチモーダル

GitHub

obsidian-neural-central

OBSIDIAN Neuralは、音楽制作者向けのリアルタイムAI音楽生成サーバーで、OBSIDIAN Neural VSTプラグインと連携しま…

#AI音楽生成 #API #GPU必須

★ 1 AGPL-3.0 2026-06-24

3D / NeRF

GitHub

perceptpick

PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-09

マルチモーダル

GitHub

uitars-mcp

UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-06-07