概要
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インターフェースのトレーニング、ベンチマーキング、ストレステストに特化した、高忠実度な48kHz医療AI音声データの無料プレビューパックです。
LJ Speech標準に準拠した24ビットモノラルWAV形式の音声ファイルとメタデータが含まれており、ローカル環境での概念実証テスト(例:Whisperファインチューニングやカスタム医療STT)に最適です。
このデータは、倫理的に収集された人間の音声データであり、HIPAAおよびGDPRに準拠しています。
想定ユーザーは、医療AIモデルの開発者や研究者で、商用利用には別途ライセンスが必要です。
互換性・特徴
- 医療データ
- 音声データセット
- STT/ASR
- TTS
- ベンチマーキング
- ローカルテスト
基本情報
| ライセンス | NOASSERTION |
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
GitHub: https://github.com/MarieDeVox/english-vocal-medical-terminology-mini
