3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル

minimind-v

★ 8.2k ⑂ 905 Apache-2.0 更新: 2026-06-28 GitHubで見る →

#Apache 2.0 License #CLI #GPU必須 #Hugging Face #Python #VLM

概要

MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトです。

GPT3の約1/2600という超小型サイズで、個人のGPUでも高速な推論や訓練を可能にします。

VLMの極めてシンプルな構造、データセットのクリーニング、事前学習、SFTといった全過程のコードが含まれており、視覚言語モデル入門者にも最適なガイドとなります。

手軽にAIの創造性を体験したい開発者や研究者に特に推奨されます。

互換性・特徴

Python
GPU必須
CLI
Apache 2.0 License
VLM
Hugging Face

基本情報

ライセンス	Apache-2.0
Stars	8,239
Forks	905
カテゴリ	マルチモーダル
アクティビティ	high

最新のissue

添加任意分辨率图片训练和推理 (更新: 2026-06-30)
全新 Python 环境执行 requirements.txt 后出现多项依赖冲突 (更新: 2026-06-27)
V4認識技術をゼロから学べるシリーズ追加の検討 (更新: 2026-05-02 / 可能增加V4识别的从0系列)
ONNXエクスポート機能の実現可能性と実装について (更新: 2026-04-23 / 导出ONNX)

最新リリース: MiniMind-V Docs (2025-10-21)

GitHub: https://github.com/jingyaogong/minimind-v

← 全リポジトリ一覧へ