概要
「Open Speech Corpora」は、音声技術の研究開発に特化した、アクセス可能でオープンな音声コーパスのリストです。
自動音声認識(ASR)やテキスト音声合成(TTS)などの多様な音声技術プロジェクトに利用できる無料の音声データセットを優先的に掲載しています。
クリエイティブ・コモンズ・ライセンスやコミュニティ・データ・ライセンス・アグリーメントの下で公開された、真にオープンなコーパスに重点を置いています。
多言語に対応した Common Voice や、英語の LJ Speech Corpus など、さまざまな言語、話者数、録音時間のデータが含まれており、研究者や開発者が音声技術の開発に活用することを想定しています。
リストへの追加提案も歓迎されています。
互換性・特徴
- 多言語対応
- オープンデータ
- 研究開発向け
基本情報
| ライセンス | MIT |
| Stars | 1,398 |
| Forks | 150 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- 無料オーディオブックの有用な情報源かもしれません (更新: 2025-12-05 / Possibly Useful Source For Free Audiobooks)
- ペルシア語TTSデータセット (更新: 2023-08-31 / Persian tts dataset)
- クレオール・ハイチ語 🙂 (更新: 2022-10-28 / kreyòl ayisyen :))
- ポッドキャストのフィラー素材 (更新: 2022-07-19 / podcast fillers)
