3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU推奨 (101 repos)

「GPU推奨」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
音声生成 / TTS
GitHub
ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
video-podcast-clipper
「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…
★ 5 MIT 2026-05-28
ASR / 音声認識
GitHub
LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
ASR / 音声認識
GitHub
AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
ComfyUI
GitHub
comfyui-model-diff-to-lora
このツールは、ComfyUI上で異なる設定の2つのMODELオブジェクト間の差分からLoRAを抽出します。複数のLoRAの積み重ね…
★ 2 ⑂ 2 2026-06-07
ASR / 音声認識
GitHub
LiveAudio
LiveAudioは、ストリーマーやコンテンツクリエイター向けのリアルタイム自動音声認識(ASR)字幕生成ツールです。Ope…
★ 2 MIT 2026-06-20
LLM
GitHub
Zephyr
Zephyrは、ローカル環境で動作するAIアシスタントです。主要なインターフェースはReact製のブラウザUI(コントロール…
★ 2 MIT 2026-05-20
3D / NeRF
GitHub
comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
音声生成 / TTS
GitHub
narrateflow
NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション…
★ 1 ⑂ 1 Apache-2.0 2026-06-14
ComfyUI
GitHub
Unified-Vision-Prompt-Generator
ComfyUI向けのプロンプト生成ツールで、画像内容をもとに各種マルチモーダルLLMからキャプションや生成用プロンプト…
★ 1 ⑂ 1 2025-11-20
画像生成
GitHub
LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
画像生成
GitHub
ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成
GitHub
Pic2Pic
EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…
★ 1 2026-06-11
マルチモーダル
GitHub
ai-learning-guides
このプロジェクトは、「AI Learning Guides」と題され、PyTorch、LLM、画像生成、強化学習、ロボティクス、マルチモ…
★ 1 MIT 2026-06-16
ComfyUI
GitHub
ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12
ComfyUI
GitHub
comfyui_maya1_tts_alun
Maya1モデルを利用して、ComfyUI上で高品質な英語音声を生成できるカスタムTTSノードです。5種類の音声プリセットに…
★ 1 ⑂ 1 MIT 2025-11-11
動画生成
GitHub
explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
音楽生成
GitHub
AI-Music-systems
このプロジェクトは、Hindustani古典音楽のラーガ(Bageshree, Khamaj, Bhoop)に特化したAI音楽生成システムです。M…
★ 1 2026-05-17
ComfyUI
GitHub
ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
ASR / 音声認識
GitHub
easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…
★ 1 MIT 2026-06-29
動画生成
GitHub
ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-06-22