← 返回资讯
大模型 @Alibaba_Qwen 2026-04-16

通义千问:Qwen3.6-35B-A3B 开源,3B 激活对标 10 倍体量

阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B、激活 3B,Apache 2.0 协议;声称编码 Agent 能力可比肩激活量 10 倍的模型,支持多模态思考与非思考双模式。

查看原文
TL;DR · 产品解读

阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B 仅激活 3B,在编码和 Agent 任务上比肩 10 倍激活量的密集模型。Apache 2.0 许可完全开源,是目前开源社区中参数效率最高的 MoE 之一。

深度解读

产品是什么

Qwen3.6-35B-A3B 是阿里通义千问团队发布的稀疏 MoE(混合专家)架构大模型。总参数量 35B,但每次推理仅激活 3B 参数——即激活比约为 1:11.7。这意味着模型拥有 35B 的「知识容量」,但只付出 3B 的「算力代价」。

该模型有两个关键特性:

许可与生态定位

模型采用 Apache 2.0 协议——这是开源圈最宽松的许可证之一,商业使用无需授权,可闭源分发。这与 Qwen2.5 系列的 Llama 风格协议不同,Apache 2.0 对企业更友好。阿里将模型权重完全开放,试图在开源社区对抗 Meta 的 Llama 系列和 Mistral 的 MoE 路线。

对比同类竞品

参考来源
  1. 通义千问官宣 Qwen3.6-35B-A3B 开源 · 2026-04-16
  2. Qwen 开源项目(ModelScope / HuggingFace) · 2026-04-16
  3. DeepSeek-V2 技术报告:MoE 架构与训练优化 · 2024-05
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。