概要
Fish Speechは、最先端のオープンソーステキスト音声合成(TTS)ツールであり、表情豊かな音声クローンと多言語対応のテキストから音声への変換を提供します。
本ツールは、開発者、研究者、コンテンツクリエーターを対象としており、特にLLMエージェントとの連携も考慮されています。
CLI、WebUI、Dockerを用いたデプロイ、サーバー推論など、多様な利用方法をサポートし、Hugging Face上でもモデルが公開されています。
これにより、高品質な音声合成を手軽に導入し、幅広いアプリケーションで活用することが可能です。
互換性・特徴
- 日本語対応
- CLI
- Web UI
- Docker
- 多言語対応
- Python
基本情報
| ライセンス | NOASSERTION |
| Stars | 30,409 |
| Forks | 2,583 |
| カテゴリ | TTS / 音声 |
| アクティビティ | high |
最新のissue
- ‘fish_speech.api’/fish_speech.infer/fish_speech’というモジュールが見つかりません (更新: 2026-05-17 / No module named ‘fish_speech.api’/fish_speech.infer/fish_speech)
- クローンなしで音声の一貫性を実現する方法 (更新: 2026-05-17 / How to achieve voice consistency, without cloning.)
- S2-Pro: 感情的に中立なトランスクリプトでの括弧内感情制御が弱い (更新: 2026-05-13 / S2-Pro: bracket emotion control appears weak on emotion-neutral transcripts)
- このモデルをDGX Spark GB10(基本的にarm64)で実行する方法 (更新: 2026-05-13 / a way to run this model on DGX Spark GB10 since its basicly arm64)
最新リリース: V1.5.1 (2025-05-31)
