3,634 repos GH 3,519 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (832 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub IndiVoice-DeepASR
IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることによ…
★ 2 MIT 2026-06-22
マルチモーダル GitHub alpamayo-trace
この「alpamayo-trace」は、NVIDIA Alpamayo R1(Vision-Language-Actionモデル)とQwen2.5-VL(Vision-Languageモデ…
★ 2 Apache-2.0 2026-05-08
画像生成 GitHub Heat-Diffusion
このリポジトリは、MAiTL-Groupによる「Physics-Informed DeepMRI: k-Space Interpolation Meets Heat Diffusion」の…
★ 2 MIT 2026-05-24
画像生成 GitHub Flux.2-Klein-Small-Decoder-Only
Flux.2-Klein-Small-Decoder-Onlyは、FLUX.2-klein-4BモデルとFLUX.2-small-decoder VAEを専用に利用する、実験的な…
★ 2 ⑂ 1 Apache-2.0 2026-06-18
画像生成 GitHub FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
ComfyUI GitHub ComfyUI-PromptDrafter-SceneQueue
ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…
★ 2 ⑂ 1 MIT 2026-03-20
3D / NeRF GitHub worldsplat
WorldSplatは、テキストプロンプトからナビゲーション可能な3Dガウスプラットシーンを生成するオープンソースツール…
★ 2 NOASSERTION 2026-03-28
動画生成 GitHub making-commercials-with-ltx-ai-video-guide
「Making Commercials with LTX AI Video Guide」は、LTX-2 AIビデオモデルを活用し、商用ビデオやマーケティングプ…
★ 2 Apache-2.0 2026-04-29
画像生成 GitHub SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
マルチモーダル GitHub video-evaluator
「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…
★ 2 MIT 2026-06-25
ComfyUI GitHub ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-06-23
画像生成 GitHub SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
音声生成 / TTS GitHub NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-06-25
マルチモーダル GitHub omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
LLM GitHub drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
画像生成 GitHub ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 2 ⑂ 1 MIT 2026-05-22
ComfyUI GitHub Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
音声生成 / TTS GitHub GPT-SoVITS-ko
このツールは、韓国語に特化した音声複製TTS(Text-to-Speech)サービスです。既存のGPT-SoVITSプロジェクトを基盤と…
★ 2 ⑂ 1 MIT 2026-05-27
ComfyUI GitHub ComfyUI-HiCache
ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…
★ 2 ⑂ 1 MIT 2026-06-11
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
3D / NeRF GitHub diff-nexel-rasterization
このリポジトリは、リアルタイムでの新規視点合成を可能にするニューラルテクスチャ付きサーフェル「Nexels」のため…
★ 2 NOASSERTION 2025-12-18
LLM GitHub flash-opd
FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…
★ 2 2026-04-22
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
LLM GitHub megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 2 ⑂ 1 MIT 2026-04-17