3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (831 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
3D / NeRF GitHub SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
音楽生成 GitHub aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 8 ⑂ 3 MIT 2026-06-28
LLM GitHub Plasmod
Plasmodは、マルチエージェントシステム向けに設計されたエージェントネイティブデータベースです。粘菌ネットワーク…
★ 8 MIT 2026-06-13
画像生成 GitHub DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15
画像生成 GitHub ScribeNEO
ScribeNEOは、Stable Diffusion Forge Neo専用に開発されたプロンプトエンジニアリング拡張機能です。AIを活用し、ユ…
★ 8 MIT 2026-05-29
マルチモーダル GitHub modalformer-lowlight
このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…
★ 8 ⑂ 2 MIT 2026-05-01
LLM GitHub genobert
GenoBERTは、遺伝子型シーケンスを言語モデリングの問題として捉えるBERTベースの深層学習モデルです。マスクされた…
★ 8 ⑂ 1 MIT 2026-05-02
ComfyUI GitHub ComfyUI-Dynamic-Sigmas
このツールは、ComfyUI用のカスタムノード「ComfyUI-Dynamic-Sigmas」です。初心者から上級者まで、拡散モデルのシグ…
★ 8 ⑂ 2 MIT 2026-03-30
ComfyUI GitHub ComfyUI-LocateAnything
「ComfyUI-LocateAnything」は、NVIDIAのLocateAnything-3BビジュアルグラウンディングモデルをComfyUIで利用可能に…
★ 8 ⑂ 3 GPL-3.0 2026-06-01
画像生成 GitHub Prox-E
Prox-Eは、SIGGRAPH 2026に採択された、3D形状の精密な編集を可能にするトレーニング不要なフレームワークです。プリ…
★ 8 ⑂ 2 MIT 2026-05-30
動画生成 GitHub KIVI
KIVIは、テキストから動画を生成するAIモデルの評価に特化したツールです。従来の「動画の見栄え」ではなく、「動画…
★ 8 MIT 2026-06-05
音声生成 / TTS GitHub Leva-TTS
Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語の…
★ 7 ⑂ 1 Apache-2.0 2026-06-02
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
音声生成 / TTS GitHub memorial-skill
「纪念.skill」は、逝去した大切な人との対話を可能にするAI記念アーカイブ作成ツールです。ユーザーは故人とのWeCha…
★ 7 ⑂ 1 MIT 2026-04-02
画像生成 GitHub comfyui-lance-aio
ComfyUI Lance AIOは、ByteDance Lance-3BモデルをComfyUIで実行するためのカスタムノードを提供するリポジトリです…
★ 7 ⑂ 2 MIT 2026-06-08
画像生成 GitHub comfyui-lora-FindingLora
「Finding LoRA — for ComfyUI」は、ComfyUIのLoRAローダーの使い勝手を大幅に改善するカスタムノードです。ブックマ…
★ 7 ⑂ 2 2026-06-07
画像生成 GitHub ltx2-vidgen-skill
この「ltx2-vidgen-skill」は、AIビデオ生成パイプラインを自社で所有・運用できるClaude Codeスキルです。写真一枚…
★ 7 ⑂ 1 NOASSERTION 2026-06-11
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
LLM GitHub kimari-local-ai
Kimariは、NVIDIA製消費者向けGPU(特にGTX 1060/1080などの古いモデル)で強力な大規模言語モデル(LLM)をローカル…
★ 7 ⑂ 1 MIT 2026-05-26
3D / NeRF GitHub higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
3D / NeRF GitHub LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
音声生成 / TTS GitHub kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
ComfyUI GitHub WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04