概要
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純粋にポーティングしたツールです。
テキスト入力から画像を生成する能力を持ち、fp16、int8、int4といった多様なチェックポイントバリアントをサポートします。
特に、Prompt Enhancer(PE)機能により、短いプロンプトからでも詳細な中国語の視覚的記述を生成し、高品質な画像を効率的に作成できます。
macOS上のApple Silicon環境でPythonを使用し、テキストから画像を生成したい開発者や研究者に最適なソリューションで、PythonライブラリおよびCLIとして利用可能です。
互換性・特徴
- GPU必須
- CLI
- Python
- 日本語対応
- macOS
- テキスト画像生成
基本情報
| ライセンス | MIT |
| Stars | 2 |
| Forks | 1 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
最新リリース: v0.4.2 (2026-05-22)
