LLM GitHub turboquantTurboQuantは、LLM(大規模言語モデル)のKVキャッシュを研究用途でベクトル量子化するためのRust製ライブラリです。… #CPU/GPU #KV Cache #LLM ★ 34 ⑂ 10 MIT 2026-03-25