マルチモーダル GitHub LLaVALLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ… #GPU必須 #Hugging Face対応 #llama.cpp互換 ★ 24.8k ⑂ 2.8k Apache-2.0 2024-08-12