← 返回资讯
大模型 @_akhaliq 2026-06-12

SpenseGPT:单次剪枝实现 LLM 推理中稀疏/密集 GEMM 融合

论文提出实用化单次剪枝方案,可在 LLM 推理中同时启用稀疏与密集矩阵乘法,提升推理效率。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。