3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

tessera

★ 243 ⑂ 4 NOASSERTION 更新: 2026-06-05 GitHubで見る →

概要

Tesseraは、大規模なLLM(教師モデル)を小型のLLM(生徒モデル)に蒸留し、その生徒モデルを効率的に提供することを目的とした、スクラッチから構築されたLLMスタックです。

カスタムのTriton/CUDAカーネル、FSDP蒸留、ページングされたKVキャッシュによる連続バッチ処理、投機的デコーディング、INT8/AWQ/FP8などの量子化技術を特徴とします。

推論エンジンへのリクエストを処理するRust製のゲートウェイも含まれます。

LLMの蒸留、効率的なデプロイ、および低レベルの最適化に関心のある開発者や研究者に適しています。

互換性・特徴

  • Python
  • Rust
  • GPU必須
  • CLI
  • LLM蒸留
  • 推論エンジン

基本情報

ライセンスNOASSERTION
Stars243
Forks4
カテゴリLLM
アクティビティmid

GitHub: https://github.com/zengxiao-he/tessera