概要
このプロジェクトは、Intel統合GPU(特にUHD 620以降)に最適化された、OpenAI互換のLLM推論APIサーバーです。
OpenVINO GenAIバックエンドとoneAPI Level Zeroドライバーを活用し、専用VRAMなしで最大12B+パラメータの大規模コーディングモデルをローカルで実行可能にします。
4GBのメモリ制限を回避し、共有システムメモリ全体を活用できるのが特徴です。
また、ブロックベースのコード生成に最適化されたDiffusion Text Modelsもサポートしています。
これにより、低スペックGPUを持つ開発者や研究者が、高性能なローカルAIアシスタンスを享受できます。
互換性・特徴
- OpenAI互換API
- GPU最適化 (Intel iGPU)
- LLM推論
- Python
- CLI
- AIコーディング
基本情報
| Stars | 1 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
