1,937 repos GH 1,822 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

vosk-api

★ 14.8k ⑂ 1,722 Apache-2.0 更新: 2026-02-22 GitHubで見る →

概要

Voskは、20以上の言語と方言(日本語含む)に対応したオフライン・オープンソースの音声認識ツールキットです。

50MBと小型ながら、連続的な大規模語彙の書き起こし、ストリーミングAPIによるゼロ遅延応答、語彙の再構成、話者識別といった機能を提供します。

Python、Java、Node.jsなど多様なプログラミング言語で利用でき、チャットボット、スマートホーム、バーチャルアシスタント、映画の字幕作成、講演やインタビューの書き起こしなど幅広い用途が想定されます。

Raspberry Piから大規模なサーバーまで、様々なデバイスで動作可能です。

互換性・特徴

  • オフライン動作
  • 多言語対応
  • Python
  • Java
  • Node.js
  • CLI
  • Android
  • iOS
  • Raspberry Pi

基本情報

ライセンスApache-2.0
Stars14,777
Forks1,722
カテゴリASR / 音声認識
アクティビティmid

最新のissue

最新リリース: v0.3.50 (2024-04-22)

GitHub: https://github.com/alphacep/vosk-api