3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (833 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub Text-to-Motion
Text-to-Motionは、テキストプロンプトからG1 Unitreeヒューマノイドロボット用の参照モーションを生成するプロジェ…
★ 11 2026-06-15
画像生成 GitHub SynPS
SynPSは、CVPR 2026で発表された、複雑な非剛体画像編集のためのトレーニング不要な手法です。位置埋め込みと意味情…
★ 11 2026-03-09
ASR / 音声認識 GitHub qwen3-asr-mt
このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR(自動音声認識)サーバーです。オリジナルのFlaskデ…
★ 11 ⑂ 1 Apache-2.0 2026-06-08
ComfyUI GitHub ComfyUI-LavaSR
ComfyUI-LavaSRは、高速な音声強調およびオーディオ超解像モデルであるLavaSRのためのComfyUIカスタムノードです。こ…
★ 10 ⑂ 1 MIT 2026-02-27
3D / NeRF GitHub 3D-RGBX
「3D-RGBX」は、CVPR 2026で注目された研究プロジェクトであり、キャリブレーションや深度情報なしで3Dの一貫性を保…
★ 10 ⑂ 2 MIT 2026-06-06
動画生成 GitHub phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 10 NOASSERTION 2026-06-08
画像生成 GitHub windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
画像生成 GitHub Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
音声生成 / TTS GitHub cosyvoice3-lora-finetuning
このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供し…
★ 10 NOASSERTION 2026-03-29
画像生成 GitHub DiffusionCreamPy
DiffusionCreamPyは、最新のAIモデルを活用してヘンタイ画像からバーやモザイクといった検閲を解除するツールです。D…
★ 10 CC-BY-4.0 2026-05-13
3D / NeRF GitHub Video-to-dataset
このツールは、ブレや重複、露出不足、動く物体によって3Dパイプラインが失敗する問題を解決するため、生の動画から…
★ 10 MIT 2026-03-29
画像生成 GitHub tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
画像生成 GitHub Animerge
Animergeは、AnimaモデルのチェックポイントやLoRAファイルをデスクトップGUIで統合的に管理・分析・学習するための…
★ 9 Apache-2.0 2026-06-24
画像生成 GitHub mlx-taef
mlx-taefは、Apple Silicon向けに最適化された、拡散ラテントを高速にデコードするTiny AutoEncoderライブラリです。…
★ 9 ⑂ 2 MIT 2026-06-23
音声生成 / TTS GitHub omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
ComfyUI GitHub video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 9 ⑂ 1 NOASSERTION 2026-05-26
音声生成 / TTS GitHub voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
ComfyUI GitHub ComfyUI-HeartMuLa
ComfyUI-HeartMuLaは、音楽生成と歌詞転写を目的としたComfyUIの拡張機能です。HeartMuLaモデルファミリーとheartlib…
★ 9 ⑂ 4 Apache-2.0 2026-02-14
LLM GitHub rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
マルチモーダル GitHub mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 9 ⑂ 1 MIT 2026-06-23
マルチモーダル GitHub SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
マルチモーダル GitHub MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
画像生成 GitHub CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
ComfyUI GitHub J-AI-Studio
J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…
★ 8 MIT 2026-05-03