概要
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプションと翻訳を提供するツールです。
ブラウザのタブやマイクから音声をキャプチャし、CrispASRによる音声認識とローカルのllama.cppサーバーによる翻訳を行います。
生成された字幕は、ブラウザ、透明なデスクトップオーバーレイ、またはOBSのブラウザソースとして表示可能です。
Vulkan対応GPUと約6GBのVRAMを搭載したWindows PCでの動作が推奨され、約5秒の低遅延を実現します。
動画視聴者やライブ配信者など、リアルタイム字幕を必要とするユーザーに最適です。
互換性・特徴
- 日本語対応
- Windows
- GPU必須
- Web UI
- OBS対応
- Python
基本情報
| ライセンス | Apache-2.0 |
| Stars | 3 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |
