3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#GPU対応 (90 repos)
「GPU対応」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub omnivoice-app
OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ(TTS)ウェブアプリケーションです。テキ…
★ 8 NOASSERTION 2026-06-12
画像生成 GitHub Ollama-UI
Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…
★ 7 ⑂ 2 MIT 2026-05-27
ASR / 音声認識 GitHub voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
画像生成 GitHub gosd
「gosd」は、Go言語で直接Stable Diffusionモデルの推論を可能にする高性能なライブラリです。stable-diffusion.cpp…
★ 7 MIT 2026-06-06
音声生成 / TTS GitHub kokopop
「kokopop」は、Pythonの依存関係なしにGGUF形式のKokoroテキスト読み上げモデルを実行するためのスタンドアロンC++…
★ 6 MIT 2026-05-29
ASR / 音声認識 GitHub ditto
DittoはWindows向けに開発された、無料かつオープンソースのローカル音声テキスト変換デスクトップアプリケーション…
★ 5 ⑂ 1 MIT 2026-05-10
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ASR / 音声認識 GitHub douyin-living
「Douyin Live AI Clipper」は、抖音(Douyin)ライブ配信を自動で録画し、AIがハイライトシーンを自動で切り出すシ…
★ 4 ⑂ 1 MIT 2026-06-04
画像生成 GitHub Nav2PlannerBattle
Nav2PlannerBattleは、ROS 2のNav2で使用される実際のプランナーとコントローラーの性能を比較できるユニークなブラ…
★ 4 Apache-2.0 2026-06-17
ASR / 音声認識 GitHub YouTube-Clipper
YouTube Clipperは、YouTube動画の特定のシークバー範囲をAlt+ドラッグで選択するだけで、その箇所の音声、Whisperに…
★ 4 MIT 2026-05-25
ASR / 音声認識 GitHub Chaty
Chatyは、ローカル環境でGGUF形式のAIモデルとプライベートなチャットを実現するデスクトップアプリケーションです。…
★ 3 MIT 2026-06-25
音声生成 / TTS GitHub Sanitune
Sanituneは、AIを活用して楽曲から不適切な言葉を自動で除去するツールです。ボーカルと伴奏を分離し、歌詞を文字起…
★ 3 ⑂ 2 GPL-3.0 2026-07-01
音声生成 / TTS GitHub voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13
ASR / 音声認識 GitHub tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
音声生成 / TTS GitHub BookVoice-AI
BookVoice-AIは、テキスト、eBook、さらには写真から高品質なAIオーディオブックを生成できるオープンソースのスタジ…
★ 2 2026-06-14
ASR / 音声認識 GitHub Qvoice
Qvoiceは、macOS向けのローカル音声テキスト変換ツールです。Controlキーをダブルタップするだけで録音の開始、停止…
★ 2 ⑂ 1 MIT 2026-06-05
音声生成 / TTS GitHub Silero-TTS-Portable
このツールは、Windows向けのポータブルなオフラインTTS(テキスト読み上げ)ソリューションです。Sileroモデルを使…
★ 2 MIT 2026-06-04
動画生成 GitHub reels_for_free
「reels_for_free」は、AIの力を活用して、視聴者の目を引くバイラル性の高いリール動画を簡単に生成するためのアプ…
★ 2 2026-06-25
ASR / 音声認識 GitHub shizi
「拾字 · Voicetype Studio」は、動画をテキストに変換し、ローカルでダウンロード・処理を行うmacOS向けのツールで…
★ 2 AGPL-3.0 2026-05-22
音声生成 / TTS GitHub Open-Vox
OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…
★ 1 NOASSERTION 2026-06-02
音声生成 / TTS GitHub MOSSlanding
MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…
★ 1 2026-06-05
マルチモーダル GitHub PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
ASR / 音声認識 GitHub perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-06-15
音楽生成 GitHub definers
Definersは、AI、メディア、データ製品を構築するチーム向けの包括的なPythonプラットフォームです。このモジュール…
★ 1 MIT 2026-06-21