1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

seshat-tts

★ 2 NOASSERTION 更新: 2026-05-13 GitHubで見る →

概要

Seshat TTSは、Windows向けのリアルタイムテキスト読み上げ(TTS)プログラムです。

ホットキーを使ってモニターやウィンドウ上の任意のテキスト領域を瞬時にキャプチャし、OCRで解析後、Kyutai Pocket TTSを通じて音声としてリアルタイムにストリーミングします。

内蔵音声の他、カスタム音声(WAV/MP3)の利用や、オプションでOpenAI互換LLMによるテキスト処理も可能です。

ゲームやアプリで画面上の情報を素早く音声化したいユーザーに最適で、リアルタイム音声クローン管理機能も備えています。

互換性・特徴

  • Windows
  • Python
  • GUI
  • TTS
  • OCR
  • リアルタイム

基本情報

ライセンスNOASSERTION
Stars2
カテゴリTTS / 音声
アクティビティlow

最新リリース: Seshat TTS 1.0 (2026-05-13)

GitHub: https://github.com/Scriptriva/seshat-tts