通义千问:Qwen3.5 系列支持 4-bit 量化近乎无损,最长支持百万级上下文
Qwen3.5 在 4-bit 权重和 KV cache 量化下保持近无损精度。27B 支持 80 万上下文,35B MoE 在 32GB 消费级显卡上支持百万级上下文,122B MoE 在 80GB 显卡支持百万+上下文。同时开源 35B-A3B-Base。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Qwen3.5 在 4-bit 权重和 KV cache 量化下保持近无损精度。27B 支持 80 万上下文,35B MoE 在 32GB 消费级显卡上支持百万级上下文,122B MoE 在 80GB 显卡支持百万+上下文。同时开源 35B-A3B-Base。
查看原文