opencode-vision

概要

opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。

ユーザーが画像を貼り付けると、自動的に画像を保存し、OpenCodeモデルがvisionツールを呼び出して画像を認識するように誘導します。

これにより、非Visionモデルでも画像の内容を理解し、その説明を返せるようになります。

単一画像だけでなく、複数画像の処理にも対応しており、OpenAI互換APIやMiniMax VLM APIと連携して動作します。

OpenCodeユーザーが画像を使った対話を行いたい場合に役立ちます。

最新リリース: v1.2.0 (2026-05-27)

GitHub: https://github.com/JochenYang/opencode-vision