概要
VLM Wikiは、Karpathy LLM Wikiの概念に基づいた、マルチモーダル対応の個人知識ベースです。
画像、動画、音声、テキストといった多様な情報をVLMとLLMを活用して取り込み、自動的に分析・整理します。
生成された知識はMarkdown形式で保存され、Obsidianで簡単に閲覧できます。
個人のあらゆる情報を一元的に管理し、パターンを発見したい研究者や情報整理に熱心なユーザーに最適です。
OpenAI、Gemini、Claude、Ollamaなどのモデルをサポートしています。
互換性・特徴
- マルチモーダル対応
- LLM活用
- VLM活用
- Obsidian連携
- Python
- Gemini対応
基本情報
| ライセンス | MIT |
| Stars | 9 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |