LMSys × NVIDIA:SGLang 在 Blackwell Ultra GB300 上实现 25 倍推理吞吐提升
LMSys 与 NVIDIA 合作展示 SGLang 在 GB300 NVL72(Blackwell Ultra)上的推理性能,相比 H200 实现 25 倍吞吐量提升,GB200 NVL72 在 4 个月内性能提升 8 倍,关键技术包括 NVFP4 GEMM 优化和计算通信重叠。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。