3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

turboquant

★ 34 ⑂ 10 MIT 更新: 2026-03-25 GitHubで見る →

概要

TurboQuantは、LLM(大規模言語モデル)のKVキャッシュを研究用途でベクトル量子化するためのRust製ライブラリです。

合成データ、トレースデータ、軽量ONNXモデルでのエンドツーエンド推論という3つのベンチマーク/評価パスを備え、CPUパスがデフォルトですが、WGPUを利用した実験的なGPUパスも提供します。

主な特徴として、再構築指向と内積指向のベクトル量子化、量子化されたKVキャッシュの管理機能があり、`distilgpt2`などの軽量モデルでの動作が検証されています。

現在のバージョンはアルファ版であり、LLMの量子化技術を研究、ベンチマーク、統合実験する開発者や研究者に特に適しています。

互換性・特徴

  • Rust
  • LLM
  • KV Cache
  • ONNX
  • CPU/GPU
  • 研究用途

基本情報

ライセンスMIT
Stars34
Forks10
カテゴリLLM
アクティビティlow

最新のissue

GitHub: https://github.com/AbdelStark/turboquant