-deepseek-skills

概要

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（音声からテキストへの変換、会議録音）の機能を追加するものです。

Ollamaのビジョンモデルとfaster-whisperの音声認識モデルをローカルで利用するため、クラウドサービスは一切不要で、完全にオフラインで動作します。

プライバシーを重視し、ローカル環境でマルチモーダルなAI機能を実現したい開発者や研究者に最適です。

画像解析、OCR、音声の文字起こし、会議の要約など、幅広い用途に対応します。

GitHub: https://github.com/jk241282/-deepseek-skills