← 返回资讯
研究 @Alibaba_Qwen 2026-02-25

通义千问:Qwen3.5 系列支持 4-bit 量化近乎无损,最长支持百万级上下文

Qwen3.5 在 4-bit 权重和 KV cache 量化下保持近无损精度。27B 支持 80 万上下文,35B MoE 在 32GB 消费级显卡上支持百万级上下文,122B MoE 在 80GB 显卡支持百万+上下文。同时开源 35B-A3B-Base。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。