3,607 repos GH 3,492 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ASR / 音声認識

vosk-api

★ 14.9k ⑂ 1,732 Apache-2.0 更新: 2026-07-02 GitHubで見る →

#Android #CLI #iOS #Java #Node.js #Python #Raspberry Pi #オフライン動作 #多言語対応

概要

Voskは、20以上の言語と方言（日本語含む）に対応したオフライン・オープンソースの音声認識ツールキットです。

50MBと小型ながら、連続的な大規模語彙の書き起こし、ストリーミングAPIによるゼロ遅延応答、語彙の再構成、話者識別といった機能を提供します。

Python、Java、Node.jsなど多様なプログラミング言語で利用でき、チャットボット、スマートホーム、バーチャルアシスタント、映画の字幕作成、講演やインタビューの書き起こしなど幅広い用途が想定されます。

Raspberry Piから大規模なサーバーまで、様々なデバイスで動作可能です。

互換性・特徴

オフライン動作
多言語対応
Python
Java
Node.js
CLI
Android
iOS
Raspberry Pi

基本情報

ライセンス	Apache-2.0
Stars	14,918
Forks	1,732
カテゴリ	ASR / 音声認識
アクティビティ	high

最新のissue

I build kannada language from scratch using kaldi with 60hr , how to finetune with 1hr? (更新: 2026-07-09)
Installation instructions: missing steps (更新: 2026-07-08)
Model Use Provided Grammar Words only when provided Grammar (更新: 2026-07-04)
Scrambled result on Chinese characters (更新: 2026-07-02)
(VoskAPI:UpdateGrammarFst():recognizer.cc:351) 語彙にない単語を無視しています (更新: 2026-06-12 / (VoskAPI:UpdateGrammarFst():recognizer.cc:351) Ignoring word missing in vocabulary)

最新リリース: v0.3.50 (2024-04-22)

GitHub: https://github.com/alphacep/vosk-api

← 全リポジトリ一覧へ