概要
parakeet.cppは、NVIDIAのParakeet音声認識モデルを超高速でC++に実装し、デバイス上での推論を可能にするライブラリです。
軽量なテンソルライブラリ「axiom」とMetal GPUアクセラレーションを活用し、PythonやONNXランタイムといった重い依存関係なしに動作します。
Apple Silicon GPUではCPUの96倍高速な推論を実現し、FP16サポートによりメモリ使用量を削減します。
複数のデコーダー、単語タイムスタンプ、ビームサーチ、ストリーミング、話者分離、マルチフォーマットオーディオ対応など、豊富な機能を備えています。
C APIも提供されており、Python、Swift、Go、Rustなどの言語からも利用可能です。
組み込みデバイスや低リソース環境での高速な音声認識を実現したい開発者や、既存のC++アプリケーションに高性能な音声認識機能を統合したいユーザーに適しています。
互換性・特徴
- C++
- CLI
- GPU必須
- Apple Silicon対応
- マルチ言語
- C API
基本情報
| ライセンス | MIT |
| Stars | 271 |
| Forks | 12 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | mid |
最新のissue
- Windowsおよび/またはLinuxのサポート計画は? (更新: 2026-04-28 / Plans to support Windows and/or Linux?)
- 配布:プレビルドされたリリース(およびHomebrewフォーミュラ)の提供 (更新: 2026-04-25 / Distribution: ship prebuilt releases (and Homebrew formula))
- ASR->LLM->TTSスタックでの使用 (更新: 2026-04-13 / Usage in ASR->LLM->TTS stack)
- より多くのASR (更新: 2026-03-05 / More ASR)