概要
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。
ユーザーが画像を貼り付けると、自動的に画像を保存し、OpenCodeモデルがvisionツールを呼び出して画像を認識するように誘導します。
これにより、非Visionモデルでも画像の内容を理解し、その説明を返せるようになります。
単一画像だけでなく、複数画像の処理にも対応しており、OpenAI互換APIやMiniMax VLM APIと連携して動作します。
OpenCodeユーザーが画像を使った対話を行いたい場合に役立ちます。
互換性・特徴
- OpenCode対応
- CLI
- Python
- Node.js
- OpenAI互換API
- MiniMax VLM
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新リリース: v1.2.0 (2026-05-27)