3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

kesha-voice-kit

★ 51 ⑂ 7 MIT 更新: 2026-06-14 GitHubで見る →

概要

「Kesha Voice Kit」は、ローカル環境で動作する高速な音声処理CLIツールです。

LLMエージェントや既存のツールに音声機能(テキスト読み上げ・音声認識)を付与することを目的としています。

Apple SiliconではWhisperの最大約19倍高速な25言語対応の音声認識と、9言語対応の音声合成、音声活動検出、言語検出機能を一つのCLIで提供します。

約20MBの単一バイナリとして動作するRust製で、Pythonやffmpegへの依存がありません。

macOS、Linux、Windowsに対応しており、自身のツールやAIエージェントに高度な音声入出力機能を手軽に統合したい開発者に最適です。

互換性・特徴

  • CLI
  • 多言語対応
  • macOS対応
  • Windows対応
  • Linux対応
  • LLMエージェント連携

基本情報

ライセンスMIT
Stars51
Forks7
カテゴリASR / 音声認識
アクティビティlow

最新のissue

最新リリース: v1.24.3 (2026-06-13)

GitHub: https://github.com/drakulavich/kesha-voice-kit