3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU必須 (831 repos)
「GPU必須」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub video-evaluator
「video-evaluator」は、動画ファイルから視覚的証拠を抽出し、コーディングエージェントによる自動レビューや視覚的…
★ 2 MIT 2026-06-25
画像生成 GitHub mythforgemtg
Myth Forgeは、単一のテーマプロンプトから、AIが生成したカスタムカードアートとプロキシフレームを用いて、テーマ…
★ 2 ⑂ 1 2026-06-18
マルチモーダル GitHub multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
LLM GitHub drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
音声生成 / TTS GitHub NeuralForge
NeuralForgeは、ローカルPCのハードウェアを利用して大規模言語モデル(LLM)をファインチューニングするためのツー…
★ 2 MIT 2026-06-25
音楽生成 GitHub melody-engine
Melody Engineは、プロンプトに基づいてインストゥルメンタル音楽を生成するツールです。GoogleのMagentaRTを薄くラ…
★ 2 Apache-2.0 2026-06-09
3D / NeRF GitHub prml-vslam
このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…
★ 2 MIT 2026-06-26
画像生成 GitHub adafactor-8bit
このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…
★ 2 MIT 2026-06-24
LLM GitHub megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 2 ⑂ 1 MIT 2026-04-17
音声生成 / TTS GitHub Python-Autodub
Python Autodubは、AIを活用した自動動画吹き替えパイプラインです。音声抽出、Demucsによるボーカル分離、DiariZen…
★ 2 ⑂ 2 MPL-2.0 2026-06-03
画像生成 GitHub DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
ASR / 音声認識 GitHub YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
3D / NeRF GitHub maya-gaussian-splatting-viewport-plugin
本ツールは、Autodesk Maya Viewport 2.0内でリアルタイム3D Gaussian Splatting(.plyファイル)レンダリングを可能…
★ 2 MIT 2026-05-28
音声生成 / TTS GitHub GPT-SoVITS-ko
このツールは、韓国語に特化した音声複製TTS(Text-to-Speech)サービスです。既存のGPT-SoVITSプロジェクトを基盤と…
★ 2 ⑂ 1 MIT 2026-05-27
LLM GitHub Auralis
Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」(Mamba-2/GLA/Sparse-Attentionベース)を利用した…
★ 2 Apache-2.0 2026-06-19
画像生成 GitHub diffusion
本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…
★ 2 2026-06-10
画像生成 GitHub FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
画像生成 GitHub ReCo-Diff
ReCo-Diffは、スパースビューCT(低線量CT)における画像再構成のための、残差条件付き決定論的サンプリングに基づく…
★ 2 MIT 2026-06-15
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
ComfyUI GitHub semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
画像生成 GitHub SwiftDiffusion
SwiftDiffusionは、Stable Diffusion 1.5に特化した、モダンで高速なPyQt6製GUIアプリケーションです。コマンドライ…
★ 2 ⑂ 1 MIT 2026-06-11
音声生成 / TTS GitHub strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
画像生成 GitHub hermes-image-local-tools
この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…
★ 2 MIT 2026-06-03