3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

open-speech-corpora

★ 1.4k ⑂ 150 MIT 更新: 2024-06-06 GitHubで見る →

概要

「Open Speech Corpora」は、音声技術の研究開発に特化した、アクセス可能でオープンな音声コーパスのリストです。

自動音声認識(ASR)やテキスト音声合成(TTS)などの多様な音声技術プロジェクトに利用できる無料の音声データセットを優先的に掲載しています。

クリエイティブ・コモンズ・ライセンスやコミュニティ・データ・ライセンス・アグリーメントの下で公開された、真にオープンなコーパスに重点を置いています。

多言語に対応した Common Voice や、英語の LJ Speech Corpus など、さまざまな言語、話者数、録音時間のデータが含まれており、研究者や開発者が音声技術の開発に活用することを想定しています。

リストへの追加提案も歓迎されています。

互換性・特徴

  • 多言語対応
  • オープンデータ
  • 研究開発向け

基本情報

ライセンスMIT
Stars1,398
Forks150
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

GitHub: https://github.com/coqui-ai/open-speech-corpora