3,613 repos GH 3,498 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル

Qwen-VL

★ 6.7k ⑂ 494 NOASSERTION 更新: 2024-08-07 GitHubで見る →

#API対応 #Hugging Face対応 #ModelScope対応 #Web UI #モバイルアプリ #日本語対応

概要

Qwen-VLは、Alibaba Cloudが開発した大規模ビジョン言語モデル「通义千问-VL」の公式リポジトリです。

Qwen-VL-PlusおよびQwen-VL-Maxは、画像関連の推論能力と詳細認識能力が大幅に強化され、100万ピクセルを超える高解像度画像や極端なアスペクト比にも対応します。

特に、テキスト指向のタスクにおいて高い性能を発揮し、中国語の質問応答やテキスト理解ではGPT-4VやGeminiを凌駕します。

Hugging FaceやModelScope、Web、API、モバイルアプリを通じて利用可能で、AIアプリケーション開発者やマルチモーダルAIの研究者、特に中国語圏のユーザーに適しています。

互換性・特徴

Web UI
API対応
モバイルアプリ
Hugging Face対応
ModelScope対応
日本語対応

基本情報

ライセンス	NOASSERTION
Stars	6,689
Forks	494
カテゴリ	マルチモーダル
アクティビティ	mid

最新のissue

vl问题 (更新: 2026-04-28)
vl问题 (更新: 2026-04-25)
vl问题 (更新: 2026-04-25)
vl问题 (更新: 2026-04-25)
vl问题 (更新: 2026-04-25)

GitHub: https://github.com/QwenLM/Qwen-VL

← 全リポジトリ一覧へ