1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

auto-audiobook

★ 3 MIT 更新: 2026-05-08 GitHubで見る →

概要

「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジンです。

Xiaomi MiMo-V2.5 TTSとLLMを基盤とし、並行合成、中断からの再開、豊富な音声選択(中国語・英語)、読書スタイルの調整などの高度な機能を備えています。

特に、長文読み上げ時の音声一貫性に関する課題を、動的チャンク分割やスタイル保持技術で解決しており、高い効率(1秒の処理で1分の音声生成)を実現します。

想定ユーザーは、目の疲れを気にせず、休憩中や運動中に気軽に読書を楽しみたい方、または電子書籍を効率的にオーディオブック化したい方々です。

手動介入なしで高並行処理が可能なため、バッチ処理にも適しています。

互換性・特徴

  • CLI
  • Python
  • TTS
  • EPUB/MOBI/PDF対応
  • 中国語/英語対応
  • MiMo-V2.5-TTS

基本情報

ライセンスMIT
Stars3
カテゴリTTS / 音声
アクティビティlow

最新リリース: v0.1.0 – 首个可用版本 (2026-05-04)

GitHub: https://github.com/Golden0Voyager/auto-audiobook