概要
livecaptionは、macOS (Apple Silicon) 向けのリアルタイムオンデバイス音声転写および翻訳を行うCLIツールです。
UIやクラウドサービスは不要で、ターミナルで実行できます。
Apple GPU/MLXを活用し、ストリーミングASR(英語音声認識)、話者分離(最大4名)、およびリアルタイムの英語から中国語への翻訳を提供します。
ASRと翻訳は共にApple GPU上で動作し、パフォーマンスを最適化しています。
主に会議や音声コンテンツのリアルタイム翻訳が必要なユーザー、特にプライバシーを重視し、デバイス上での処理を好む技術者や研究者を想定しています。
互換性・特徴
- macOS
- Apple Silicon
- CLI
- GPU必須
- Python
- リアルタイム翻訳
基本情報
| Stars | 7 |
| Forks | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
