1,910 repos GH 1,795 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ETCHR

★ 12 NOASSERTION 更新: 2026-05-25 GitHubで見る →

概要

ETCHR (Editing To Clarify and Harness Reasoning)は、質問条件に基づいて推論を意識した画像エディタです。

マルチモーダル大規模言語モデル(MLLM)の視覚的推論アシスタントとして機能し、MLLMから独立したモジュールとして動作します。

これにより、きめ細かい画像理解や複雑な空間変換が必要な場面で、テキストのみの推論が困難なボトルネックを解消します。

Qwen3-VL-8BやGemini-3.1-Flash-Liteといった多様なMLLMに対し、個別のファインチューニングなしで「プラグアンドプレイ」で利用可能です。

Edit-Verify-Reasonという推論パイプラインを通じて、編集の信頼性を確保し、高い精度での画像理解を支援します。

主にMLLMの研究者や開発者が、視覚的推論能力を向上させるために利用することが想定されます。

互換性・特徴

  • Python
  • CLI
  • Hugging Face
  • GPU必須
  • MLLM連携

基本情報

ライセンスNOASSERTION
Stars12
カテゴリマルチモーダル
アクティビティlow

GitHub: https://github.com/InternLM/ETCHR