GLM 5.1 优化聚焦 topk 内核三大改进
重写 topk 内核、融合索引器降低内存与启动开销、消除限制预填充吞吐的 CPU 开销,索引器改进最大,GLM 5.1 已上线 Together AI。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
重写 topk 内核、融合索引器降低内存与启动开销、消除限制预填充吞吐的 CPU 开销,索引器改进最大,GLM 5.1 已上线 Together AI。
查看原文