概要
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。
Windows 11とWSL2 (Ubuntu)を基盤とし、`mistralai/Voxtral-Mini-3B-2507`モデルをvLLMとGradioを通じて利用します。
外部のMistralやOpenAIといったクラウドAPIに依存せず、すべての処理をオフラインで完結させることが特徴です。
オーディオファイルをアップロードすると、書き起こし、チャンク化、生のテキスト化、最終的な要約が行われ、その履歴も保存されます。
リアルタイム処理には対応していません。
主に、プライバシーを重視し、強力なNVIDIA GPUを搭載したWindows 11ユーザーで、個人的な音声記録のテキスト化と要約を行いたい方を対象としています。
互換性・特徴
- Windows
- WSL2
- Python
- Web UI
- GPU必須
- ローカル実行
基本情報
| ライセンス | NOASSERTION |
| Stars | 1 |
| カテゴリ | ASR / 音声認識 |
| アクティビティ | low |