ComfyUI GitHub ComfyUI
ComfyUIは、画像、ビデオ、3Dモデル、オーディオなどのコンテンツをAIで生成するための強力かつモジュール式のエンジ…
★ 118.6k ⑂ 13.9k GPL-3.0 2026-06-28
LLM GitHub PaddleOCR
PaddleOCRは、PDFや画像ドキュメントを構造化されたデータ(JSON/Markdown)に変換し、大規模言語モデル(LLM)で活…
★ 84.1k ⑂ 10.9k Apache-2.0 2026-06-26
音声生成 / TTS GitHub Real-Time-Voice-Cloning
このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TT…
★ 60.0k ⑂ 9.4k NOASSERTION 2026-03-09
ASR / 音声認識 GitHub whisper.cpp
whisper.cppは、OpenAIの高性能な音声認識モデルWhisperをC/C++で軽量に実装したライブラリです。依存関係を最小限に…
★ 51.1k ⑂ 5.7k MIT 2026-06-26
LLM GitHub tabby
Tabbyは、GitHub Copilotのオープンソースでオンプレミスな代替となるセルフホスト型AIコーディングアシスタントです…
★ 33.7k ⑂ 1.8k NOASSERTION 2026-03-02
ASR / 音声認識 GitHub faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.9k ⑂ 2.0k MIT 2025-11-19
ASR / 音声認識 GitHub buzz
Buzzは、OpenAIのWhisperを搭載し、個人用コンピューター上で音声の文字起こしと翻訳をオフラインで実行できる高機能…
★ 19.9k ⑂ 1.5k MIT 2026-06-27
音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.3k ⑂ 1.6k Apache-2.0 2026-06-26
ASR / 音声認識 GitHub kaldi
Kaldiは、音声認識技術の開発と研究のための包括的なオープンソースツールキットです。UNIX系OS、Windows、Linuxとい…
★ 15.4k ⑂ 5.4k NOASSERTION 2025-09-22
マルチモーダル GitHub ms-swift
ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル(LLM)およびマルチモーダル大規模言語モデル(ML…
★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24
画像生成 GitHub openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
マルチモーダル GitHub BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
画像生成 GitHub nexa-sdk
NexaSDKは、AIモデルをデバイス上で最小限のエネルギーで高速かつスマートに実行するための高性能ローカル推論フレー…
★ 8.1k ⑂ 1.0k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
ASR / 音声認識 GitHub vibe
Vibeは、OpenAI Whisper技術を利用してオーディオやビデオをオフラインで高精度に文字起こしするツールです。データ…
★ 6.6k ⑂ 427 MIT 2026-05-01
画像生成 GitHub stable-diffusion.cpp
stable-diffusion.cppは、Diffusionモデル(SD、Flux、Wanなど)の推論を純粋なC/C++で実行するための超軽量ライブラ…
★ 6.4k ⑂ 679 MIT 2026-06-26
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25
ASR / 音声認識 GitHub silero-models
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。このツール…
★ 6.0k ⑂ 366 NOASSERTION 2026-06-04
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 5.2k ⑂ 279 MIT 2026-06-24
3D / NeRF GitHub brush
Brushは、Gaussian splattingを活用した3D再構築エンジンです。macOS、Windows、Linux、Android、Webブラウザなど、…
★ 4.8k ⑂ 273 Apache-2.0 2026-06-24
ASR / 音声認識 GitHub whisper-jax
Whisper JAXは、OpenAIのWhisperモデルをJAXで実装したもので、特にTPUでの実行時にOpenAIのPyTorch版と比較して最大…
★ 4.7k ⑂ 414 Apache-2.0 2024-04-03
AIエージェント GitHub awesome-opensource-ai
このリポジトリは、オープンソースのAIプロジェクト、モデル、ツール、インフラストラクチャを厳選したリストです。P…
★ 4.0k ⑂ 466 CC0-1.0 2026-06-28
ComfyUI GitHub VibeVoice-ComfyUI
VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。これによ…
★ 1.5k ⑂ 242 MIT 2026-02-18
音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 315 MIT 2026-05-26