概要
Seshat TTSは、Windows向けのリアルタイムテキスト読み上げ(TTS)プログラムです。
ホットキーを使ってモニターやウィンドウ上の任意のテキスト領域を瞬時にキャプチャし、OCRで解析後、Kyutai Pocket TTSを通じて音声としてリアルタイムにストリーミングします。
内蔵音声の他、カスタム音声(WAV/MP3)の利用や、オプションでOpenAI互換LLMによるテキスト処理も可能です。
ゲームやアプリで画面上の情報を素早く音声化したいユーザーに最適で、リアルタイム音声クローン管理機能も備えています。
互換性・特徴
- Windows
- Python
- GUI
- TTS
- OCR
- リアルタイム
基本情報
| ライセンス | NOASSERTION |
| Stars | 2 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新リリース: Seshat TTS 1.0 (2026-05-13)
