概要
InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。
特にInternVL3.5は、汎用性、推論能力、推論効率において最先端の結果を達成しており、商用モデルの強力な代替となります。
開発者や研究者は、Hugging FaceフォーマットやGitHubフォーマットで利用でき、多様な多モーダルタスクに対応可能です。
大規模なモデルであるため、GPU環境での利用が想定されます。
互換性・特徴
- オープンソース
- Hugging Face対応
- Python
- 多モーダル
- 会話モデル
- GPU必須
基本情報
| ライセンス | MIT |
| Stars | 10,027 |
| Forks | 777 |
| カテゴリ | マルチモーダル |
| アクティビティ | mid |
最新のissue
- [Feature] 3.5にはまだファインチューニングスクリプトがない (更新: 2026-05-14 / [Feature] 3.5还没有微调脚本)
- 座標抽出が不正確 (更新: 2026-04-24 / 坐标提取不准确)
- Internvl3.5-8b と Internvl3.5-38b vLLM推論での文字化け (更新: 2026-04-21 / Internvl3.5-8b 和 internvl3.5-38b vllm推理乱码)
- InternVL3.5のルータートレーニングについて (更新: 2026-04-01 / 关于InternVL3.5的Router training)
- InternVL3-9Bアーキテクチャに関する説明:言語モデルコードベース(InternLM2 vs. InternLM3)とWqkvレイアウト (更新: 2026-03-24 / Clarification on InternVL3-9B Architecture: Language Model Codebase (InternLM2 vs. InternLM3) and Wqkv Layout)
最新リリース: InternVL-Chat-V1.5.0 (2024-05-08)
