概要
Mobile-Oは、モバイルデバイス上で動作する、統一されたマルチモーダルAIモデルです。
画像理解(VQA、OCR、推論)と画像生成(テキストから画像、画像編集)の両方を、単一のコンパクトなアーキテクチャで実現します。
オンデバイスでリアルタイムに動作し、2GB未満のメモリ消費で高速な画像生成と視覚理解を提供します。
iOSアプリとしても提供されており、iPhone 15 Pro以降で利用可能です。
モバイルAIアプリケーションの開発者や、エッジデバイスでのAI活用を求める研究者、および画像生成や理解をモバイルで手軽に行いたい一般ユーザーを想定しています。
互換性・特徴
- モバイル対応
- iOS対応
- Python
- CLI
- マルチモーダルAI
- エッジAI
基本情報
| ライセンス | NOASSERTION |
| Stars | 147 |
| Forks | 16 |
| カテゴリ | 画像生成 |
| アクティビティ | mid |
最新のissue
- post trainingに関する質問 (更新: 2026-05-25 / An question about post training)
- ツールコーリング (更新: 2026-03-06 / Tool calling)
- セマンティック通信ユースケースのためのMobile-Oの探索 — 独立したiOS実装からの接続 (更新: 2026-03-05 / Exploring Mobile-O for semantic communication use cases — connection from an independent iOS implementation)
