voxtral-journal

概要

このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。

Windows 11とWSL2 (Ubuntu)を基盤とし、`mistralai/Voxtral-Mini-3B-2507`モデルをvLLMとGradioを通じて利用します。

外部のMistralやOpenAIといったクラウドAPIに依存せず、すべての処理をオフラインで完結させることが特徴です。

オーディオファイルをアップロードすると、書き起こし、チャンク化、生のテキスト化、最終的な要約が行われ、その履歴も保存されます。

リアルタイム処理には対応していません。

主に、プライバシーを重視し、強力なNVIDIA GPUを搭載したWindows 11ユーザーで、個人的な音声記録のテキスト化と要約を行いたい方を対象としています。

最新リリース: 1.0 (2026-05-14)

GitHub: https://github.com/JMS1717/voxtral-journal