3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

BaltiVoice-ASR

★ 1 MIT 更新: 2026-06-03 GitHubで見る →

概要

BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)システムです。

オープンソースのWhisper-smallモデルをバルティ語データでファインチューニングし、30%のWERを達成しています。

Hugging Faceでモデルとデータセットが公開されており、Gradioによるライブデモも利用可能です。

わずか約16時間のデータで高品質なASRを可能にし、Pythonで利用できます。

バルティ語話者が自言語でのデジタルツールを利用できるようにするほか、低リソース言語の研究者や、バルティ語対応アプリケーションを開発するエンジニア、そしてバルティ文化の保存に関心のある人々を対象としています。

このプロジェクトは、AIを通じてバルティ語の口頭伝承を保存し、デジタル世界での存在感を確立することを目的としています。

互換性・特徴

  • Python
  • ASR
  • Hugging Face
  • Web UI
  • 低リソース言語
  • AI/ML

基本情報

ライセンスMIT
Stars1
カテゴリASR / 音声認識
アクティビティlow

最新リリース: v1.0.0 – First Public Release of BaltiVoice ASR (2026-05-28)

GitHub: https://github.com/mohdali-dev/BaltiVoice-ASR