概要
「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジンです。
Xiaomi MiMo-V2.5 TTSとLLMを基盤とし、並行合成、中断からの再開、豊富な音声選択(中国語・英語)、読書スタイルの調整などの高度な機能を備えています。
特に、長文読み上げ時の音声一貫性に関する課題を、動的チャンク分割やスタイル保持技術で解決しており、高い効率(1秒の処理で1分の音声生成)を実現します。
想定ユーザーは、目の疲れを気にせず、休憩中や運動中に気軽に読書を楽しみたい方、または電子書籍を効率的にオーディオブック化したい方々です。
手動介入なしで高並行処理が可能なため、バッチ処理にも適しています。
互換性・特徴
- CLI
- Python
- TTS
- EPUB/MOBI/PDF対応
- 中国語/英語対応
- MiMo-V2.5-TTS
基本情報
| ライセンス | MIT |
| Stars | 3 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
最新リリース: v0.1.0 – 首个可用版本 (2026-05-04)
