3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

open-speech-corpora

★ 1.4k ⑂ 150 MIT 更新: 2024-06-06 GitHubで見る →

#オープンデータ #多言語対応 #研究開発向け

概要

「Open Speech Corpora」は、音声技術の研究開発に特化した、アクセス可能でオープンな音声コーパスのリストです。

自動音声認識（ASR）やテキスト音声合成（TTS）などの多様な音声技術プロジェクトに利用できる無料の音声データセットを優先的に掲載しています。

クリエイティブ・コモンズ・ライセンスやコミュニティ・データ・ライセンス・アグリーメントの下で公開された、真にオープンなコーパスに重点を置いています。

多言語に対応した Common Voice や、英語の LJ Speech Corpus など、さまざまな言語、話者数、録音時間のデータが含まれており、研究者や開発者が音声技術の開発に活用することを想定しています。

リストへの追加提案も歓迎されています。

互換性・特徴

多言語対応
オープンデータ
研究開発向け

基本情報

ライセンス	MIT
Stars	1,398
Forks	150
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

無料オーディオブックの有用な情報源かもしれません (更新: 2025-12-05 / Possibly Useful Source For Free Audiobooks)
ペルシア語TTSデータセット (更新: 2023-08-31 / Persian tts dataset)
クレオール・ハイチ語 🙂 (更新: 2022-10-28 / kreyòl ayisyen :))
ポッドキャストのフィラー素材 (更新: 2022-07-19 / podcast fillers)

GitHub: https://github.com/coqui-ai/open-speech-corpora

← 全リポジトリ一覧へ