3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

MGM

★ 3.3k ⑂ 275 Apache-2.0 更新: 2024-05-04 GitHubで見る →

概要

「Mini-Gemini」は、画像理解、推論、生成を同時に行うことができるマルチモダリティ大規模言語モデル(LLM)フレームワークです。

LLaVAをベースに、2Bから34Bまでの多様なLLM(LLaMA3ベース含む)をサポートし、デュアルビジョンエンコーダーやパッチ情報マイニング技術により、高解像度の画像処理とテキスト連携を実現します。

研究者や開発者が、画像とテキストを統合した高度なAIアプリケーションを構築し、複雑なマルチモーダルタスクに取り組むことを想定しています。

互換性・特徴

  • Python
  • GPU必須
  • Web UI
  • Hugging Face対応
  • LLMフレームワーク
  • 研究/開発ツール

基本情報

ライセンスApache-2.0
Stars3,326
Forks275
カテゴリマルチモーダル
アクティビティmid

最新のissue

GitHub: https://github.com/JIA-Lab-research/MGM