3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#GPU対応 (90 repos)

「GPU対応」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

omnivoice-app

OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ（TTS）ウェブアプリケーションです。テキ…

#Docker #GPU対応 #Python

★ 8 NOASSERTION 2026-06-12

画像生成

GitHub

Ollama-UI

Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…

#GPU対応 #Ollama #Python

★ 7 ⑂ 2 MIT 2026-05-27

ASR / 音声認識

GitHub

voice-input

本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…

#GPU対応 #Linux対応 #macOS対応

★ 7 MIT 2026-06-15

画像生成

GitHub

gosd

「gosd」は、Go言語で直接Stable Diffusionモデルの推論を可能にする高性能なライブラリです。stable-diffusion.cpp…

#CLI #CPU対応 #Go

★ 7 MIT 2026-06-06

音声生成 / TTS

GitHub

kokopop

「kokopop」は、Pythonの依存関係なしにGGUF形式のKokoroテキスト読み上げモデルを実行するためのスタンドアロンC++…

#C++ライブラリ #CLI #GPU対応

★ 6 MIT 2026-05-29

ASR / 音声認識

GitHub

ditto

DittoはWindows向けに開発された、無料かつオープンソースのローカル音声テキスト変換デスクトップアプリケーション…

#GPU対応 #Windows #オフライン

★ 5 ⑂ 1 MIT 2026-05-10

ASR / 音声認識

GitHub

Mynah

Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…

#CLI #Discord対応 #GPU対応

★ 5 NOASSERTION 2026-06-11

ASR / 音声認識

GitHub

douyin-living

「Douyin Live AI Clipper」は、抖音（Douyin）ライブ配信を自動で録画し、AIがハイライトシーンを自動で切り出すシ…

#AI #CLI #GPU対応

★ 4 ⑂ 1 MIT 2026-06-04

画像生成

GitHub

Nav2PlannerBattle

Nav2PlannerBattleは、ROS 2のNav2で使用される実際のプランナーとコントローラーの性能を比較できるユニークなブラ…

#GPU対応 #ONNX #Python

★ 4 Apache-2.0 2026-06-17

ASR / 音声認識

GitHub

YouTube-Clipper

YouTube Clipperは、YouTube動画の特定のシークバー範囲をAlt+ドラッグで選択するだけで、その箇所の音声、Whisperに…

#Chrome拡張機能 #CLI #GPU対応

★ 4 MIT 2026-05-25

ASR / 音声認識

GitHub

Chaty

Chatyは、ローカル環境でGGUF形式のAIモデルとプライベートなチャットを実現するデスクトップアプリケーションです。…

#GGUF対応 #GPU対応 #Rust

★ 3 MIT 2026-06-25

音声生成 / TTS

GitHub

Sanitune

Sanituneは、AIを活用して楽曲から不適切な言葉を自動で除去するツールです。ボーカルと伴奏を分離し、歌詞を文字起…

#AI #CLI #Docker

★ 3 ⑂ 2 GPL-3.0 2026-07-01

音声生成 / TTS

GitHub

voice-to-text

CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…

#CLI #Google Cloud #GPU対応

★ 3 2026-05-13

ASR / 音声認識

GitHub

tellix

Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…

#GPU対応 #Python #Windows

★ 3 MIT 2026-05-19

音声生成 / TTS

GitHub

BookVoice-AI

BookVoice-AIは、テキスト、eBook、さらには写真から高品質なAIオーディオブックを生成できるオープンソースのスタジ…

#CLI #Docker #GPU対応

★ 2 2026-06-14

ASR / 音声認識

GitHub

Qvoice

Qvoiceは、macOS向けのローカル音声テキスト変換ツールです。Controlキーをダブルタップするだけで録音の開始、停止…

#GPU対応 #macOS #Python

★ 2 ⑂ 1 MIT 2026-06-05

音声生成 / TTS

GitHub

Silero-TTS-Portable

このツールは、Windows向けのポータブルなオフラインTTS（テキスト読み上げ）ソリューションです。Sileroモデルを使…

#GPU対応 #SSML対応 #TTS

★ 2 MIT 2026-06-04

動画生成

GitHub

reels_for_free

「reels_for_free」は、AIの力を活用して、視聴者の目を引くバイラル性の高いリール動画を簡単に生成するためのアプ…

#AI #CLI #GPU対応

★ 2 2026-06-25

ASR / 音声認識

GitHub

shizi

「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…

#CLI #GPU対応 #macOS

★ 2 AGPL-3.0 2026-05-22

音声生成 / TTS

GitHub

Open-Vox

OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…

#GPU対応 #Python #Tkinter

★ 1 NOASSERTION 2026-06-02

音声生成 / TTS

GitHub

MOSSlanding

MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…

#GPU対応 #Python #オフライン動作

★ 1 2026-06-05

マルチモーダル

GitHub

PROSOPO

「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…

#CLI #Docker #GPU対応

★ 1 2026-05-22

ASR / 音声認識

GitHub

perihelion

Perihelionは、VRChat向けに設計された音声認識（ASR）アプリケーションです。VRChatとOSCを介して連携し、ユーザー…

#GPU対応 #OSC対応 #VRChat連携

★ 1 2026-06-15

音楽生成

GitHub

definers

Definersは、AI、メディア、データ製品を構築するチーム向けの包括的なPythonプラットフォームです。このモジュール…

#AI #CLI #GPU対応

★ 1 MIT 2026-06-21