3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

orthrus

★ 423 ⑂ 17 MIT 更新: 2026-05-18 GitHubで見る →

概要

Orthrusは、大規模言語モデル(LLM)の推論を高速化するためのデュアルアーキテクチャフレームワークです。

自己回帰型LLMの正確な生成忠実性と、拡散モデルの高速な並列トークン生成を統合し、最大7.8倍の推論加速をロスレスで実現します。

特徴として、O(1)のメモリキャッシュオーバーヘッドで高いメモリ効率を誇り、モデル全体の16%のパラメータのみをファインチューニングすることで並列生成能力を付与します。

既存の投機的デコーディング手法と比較して優れたパフォーマンスを発揮するため、LLMの推論速度向上を目指す開発者や研究者に最適なツールです。

互換性・特徴

  • Python
  • GPU必須
  • HuggingFace対応
  • CLI
  • Colab対応

基本情報

ライセンスMIT
Stars423
Forks17
カテゴリLLM
アクティビティmid

最新のissue

GitHub: https://github.com/chiennv2000/orthrus