3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU推奨 (101 repos)
「GPU推奨」タグが付いたリポジトリ
← 全リポジトリ
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 16 ↓ 264 cc-by-nc-sa-4.0 2026-06-26
マルチモーダル HF moss-video-preview-base
MOSS-Video-Preview-Baseは、動画と言語をネイティブに統合して扱うクロスアテンション型の事前学習ベースモデルです…
❤ 13 ↓ 23 apache-2.0 2026-06-09
ASR / 音声認識 GitHub AI-Medical-Scribe
AI Medical Scribeは、ブラウザ内で完結するローカルファーストのAI医療記録ツールです。バックエンドやAPIキーが不…
★ 13 ⑂ 1 MIT 2026-05-22
LLM GitHub tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
音声生成 / TTS GitHub ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
ASR / 音声認識 GitHub video-podcast-clipper
「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…
★ 5 MIT 2026-05-28
ASR / 音声認識 GitHub LiveDialogue-Translator
LiveDialogue-Translatorは、Windowsデスクトップ向けのローカルファーストなキャプションアプリです。システムおよ…
★ 3 ⑂ 1 Apache-2.0 2026-05-15
ASR / 音声認識 GitHub doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
ComfyUI GitHub comfyui-model-diff-to-lora
このツールは、ComfyUI上で異なる設定の2つのMODELオブジェクト間の差分からLoRAを抽出します。複数のLoRAの積み重ね…
★ 2 ⑂ 2 2026-06-07
ASR / 音声認識 GitHub LiveAudio
LiveAudioは、ストリーマーやコンテンツクリエイター向けのリアルタイム自動音声認識(ASR)字幕生成ツールです。Ope…
★ 2 MIT 2026-06-20
LLM GitHub Zephyr
Zephyrは、ローカル環境で動作するAIアシスタントです。主要なインターフェースはReact製のブラウザUI(コントロール…
★ 2 MIT 2026-05-20
マルチモーダル GitHub ai-learning-guides
このプロジェクトは、「AI Learning Guides」と題され、PyTorch、LLM、画像生成、強化学習、ロボティクス、マルチモ…
★ 1 MIT 2026-06-16
ComfyUI GitHub Unified-Vision-Prompt-Generator
ComfyUI向けのプロンプト生成ツールで、画像内容をもとに各種マルチモーダルLLMからキャプションや生成用プロンプト…
★ 1 ⑂ 1 2025-11-20
ComfyUI GitHub ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12
動画生成 GitHub explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
ComfyUI GitHub comfyui_maya1_tts_alun
Maya1モデルを利用して、ComfyUI上で高品質な英語音声を生成できるカスタムTTSノードです。5種類の音声プリセットに…
★ 1 ⑂ 1 MIT 2025-11-11
音楽生成 GitHub AI-Music-systems
このプロジェクトは、Hindustani古典音楽のラーガ(Bageshree, Khamaj, Bhoop)に特化したAI音楽生成システムです。M…
★ 1 2026-05-17
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
ASR / 音声認識 GitHub easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…
★ 1 MIT 2026-06-29
動画生成 GitHub ComfyUI-AceStep_SFT
ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…
★ 1 MIT 2026-06-22
3D / NeRF GitHub comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11