3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASRT_SpeechRecognition

★ 8.4k ⑂ 1,898 GPL-3.0 更新: 2026-04-10 GitHubで見る →

概要

ASRTは、TensorFlow.kerasを基盤とした深層学習ベースの中国語音声認識システムです。

深度畳み込みニューラルネットワーク、長短期記憶ニューラルネットワーク、注意機構、およびCTCを採用し、最大16秒の音声入力から中国語のピンインシーケンスを出力します。

訓練には高性能GPUが推奨され、Linux環境で利用可能。

Windowsでは推論のみサポートします。

CLIツールとしての機能に加え、HTTPおよびgRPCプロトコルによるAPIサーバーを提供し、Dockerでのデプロイも可能。

本ツールは、中国語音声認識技術に関心のある開発者や研究者、既存システムに音声認識機能を統合したいユーザーに適しています。

互換性・特徴

  • Python
  • TensorFlow
  • CLI
  • Web API
  • 中国語対応
  • GPU必須

基本情報

ライセンスGPL-3.0
Stars8,374
Forks1,898
カテゴリASR / 音声認識
アクティビティmid

最新のissue

最新リリース: ASRT v1.3.0 Released (2022-05-20)

GitHub: https://github.com/nl8590687/ASRT_SpeechRecognition