LLM GitHub tokenspeedTokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL… #Agentic Workloads #C++ #GPU必須 ★ 985 ⑂ 79 MIT 2026-05-13