1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

IndiVoice-DeepASR

★ 1 MIT 更新: 2026-05-19 GitHubで見る →

概要

IndiVoice-DeepASRは、OpenAIのWhisperモデルをLoRA(Low-Rank Adaptation)技術でファインチューニングすることにより、インド英語アクセントの音声認識精度を大幅に向上させる研究プロジェクトです。

既存のASRシステムがインド英語アクセントで抱える性能低下(20-30%)を解消し、ヒンディー語、タミル語など多様な地域アクセントに対応します。

総パラメータの2%未満で効率的な学習が可能で、フォールトトレラントなトレーニング機能も備えているため、研究者や開発者がクラウド環境(Colab/Kaggle)で高品質なインド英語ASRモデルを開発するのに最適です。

互換性・特徴

  • Whisper (OpenAI)
  • LoRA / PEFT
  • PyTorch
  • GPU必須
  • Python
  • クラウドベース
  • Gradio

基本情報

ライセンスMIT
Stars1
カテゴリASR / 音声認識
アクティビティlow

最新のissue

GitHub: https://github.com/PxA-Labs/IndiVoice-DeepASR