概要
MMagic (OpenMMLab Multimodal Advanced, Generative, and Intelligent Creation Toolbox)は、テキストから画像生成、画像・動画の復元・強化などを可能にするマルチモーダル生成AIのツールキットです。
拡散モデルを含む豊富なモデルZooと使いやすいAPIを提供し、最新のPowerPaintのような高度なインペインティングアルゴリズムも利用できます。
AIによるコンテンツ生成(AIGC)に関心のある研究者や開発者、またマルチモーダルなメディア操作を行いたいユーザーを対象としています。
互換性・特徴
- Python
- CLI
- Web UI
- API提供
- GPU必須
基本情報
| ライセンス | Apache-2.0 |
| Stars | 7,431 |
| Forks | 1,099 |
| カテゴリ | 画像生成 |
| アクティビティ | mid |
最新のissue
- [Feature] このライブラリは画像から動画生成をサポートしていますか? (更新: 2026-04-23 / [Feature] 这个库支持图片生成视频吗?)
- [Bug] TrainステップでConcatImageVisualizerを使用できません。 (更新: 2025-04-17 / [Bug] Can not use `ConcatImageVisualizer` in train step. / 在Train阶段可视化存在bug)
- [Bug] MMagic Inpaintingがimgおよびmaskのnp.ndarray入力タイプで動作しません。 (更新: 2025-03-18 / [Bug] MMagic Inpainting not working with np.ndarray input type for `img` and `mask`)
- [Feature] コードとドキュメントの質が非常に悪いです。[Docs] (更新: 2025-01-08 / [Feature] The code and documentation are really terrible[Docs])
- [Bug] MMCV-Fullが必要ですが、インストールに失敗しました。 (更新: 2025-01-08 / [Bug] MMCV-Full required but failed installation)
最新リリース: MMagic v1.2.0 Release (2023-12-18)
