概要
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革新的なLLMアーキテクチャです。
長シーケンスの効率的なモデリングを可能にし、トークンエンタングルメントによる情報フローの強化、PyTorch/CUDA/Triton/TileLangのマルチバックエンド対応、INT2量子化による推論高速化、そして10Mから400Bまでの柔軟なモデル設定が特徴です。
大規模言語モデルの効率的なシーケンスモデリングに関心を持つ研究者や開発者、特に長文処理やリソース効率を重視するAIエンジニアに最適です。
互換性・特徴
- Python
- PyTorch
- CUDA
- Triton
- CLI
- GPU必須
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | LLM |
| アクティビティ | low |
