通义千问:Qwen3.6-35B-A3B 开源,3B 激活对标 10 倍体量
阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B、激活 3B,Apache 2.0 协议;声称编码 Agent 能力可比肩激活量 10 倍的模型,支持多模态思考与非思考双模式。
查看原文TL;DR · 产品解读
阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B 仅激活 3B,在编码和 Agent 任务上比肩 10 倍激活量的密集模型。Apache 2.0 许可完全开源,是目前开源社区中参数效率最高的 MoE 之一。
深度解读
产品是什么
Qwen3.6-35B-A3B 是阿里通义千问团队发布的稀疏 MoE(混合专家)架构大模型。总参数量 35B,但每次推理仅激活 3B 参数——即激活比约为 1:11.7。这意味着模型拥有 35B 的「知识容量」,但只付出 3B 的「算力代价」。
该模型有两个关键特性:
- 双模式思考:支持「思考模式」(Chain-of-Thought推理)和「非思考模式」(直接回答),用户可按任务切换。
- 多模态 + Agent 优化:官方声称编码能力和 Agent 任务表现可比肩激活量 10 倍(30B 级别)的模型,暗示 MoE 路由在代码补全、任务拆解等场景有专项调优。
许可与生态定位
模型采用 Apache 2.0 协议——这是开源圈最宽松的许可证之一,商业使用无需授权,可闭源分发。这与 Qwen2.5 系列的 Llama 风格协议不同,Apache 2.0 对企业更友好。阿里将模型权重完全开放,试图在开源社区对抗 Meta 的 Llama 系列和 Mistral 的 MoE 路线。
对比同类竞品
- vs. DeepSee
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
参考来源
- 通义千问官宣 Qwen3.6-35B-A3B 开源 · 2026-04-16
- Qwen 开源项目(ModelScope / HuggingFace) · 2026-04-16
- DeepSeek-V2 技术报告:MoE 架构与训练优化 · 2024-05
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。