概要
「Tongues」は、書かれたテキストと発音の間の可逆マッピング(Grapheme-to-PhonemeおよびPhoneme-to-Grapheme)に特化したRust製のニューラル音声・言語処理ツールキットです。
静的な辞書とは異なり、既存の発音辞書から学習し、未知の単語の発音も予測・生成できます。
主な特徴として、RustとBurn 0.21フレームワークを採用し、ニューラルアーティファクトメタデータ管理、OpenEPDベースのデータ準備、対話型REPLによる推論機能を提供します。
将来的には多言語発音モデリング、文解析、そしてTTS/ASRのフロントエンド機能へと拡張を目指しています。
想定ユーザーは、音声合成(TTS)や自動音声認識(ASR)のフロントエンド開発者、言語学者、そしてテキスト解析や発音モデリングに興味を持つ研究者や開発者です。
互換性・特徴
- Rust
- ニューラルネットワーク
- G2P
- P2G
- CLI
- TTS
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
