← 返回资讯
产品发布 @Alibaba_Qwen 2026-02-25

通义千问:Qwen3.5-35B-A3B 已上线 LM Studio

Qwen3.5-35B-A3B 模型现已在 LM Studio 上线,用户可直接下载使用该 MoE 模型进行本地推理。

查看原文
TL;DR · 产品解读

通义千问发布 Qwen3.5-35B-A3B MoE 模型登陆 LM Studio,意味着用户可在消费级硬件上跑 35B 参数级别的模型。3.5B 激活参数的设计让本地部署门槛大幅降低,对个人开发者和边缘场景意义显著。

深度解读

产品是什么

Qwen3.5-35B-A3B 是阿里巴巴通义千问团队发布的下一代 MoE(混合专家)架构模型。其中 35B 表示总参数量,A3B 代表激活参数量为 3.5B。这种架构意味着模型总计有 350 亿参数,但在推理时每次只激活 35 亿参数参与计算,理论上能以接近 3.5B 模型的资源消耗达到接近 35B 模型的能力上限。

此次上线 LM Studio 意味着该模型以 GGUF 量化格式提供,用户无需依赖云端 API,直接在本地 Mac/Windows/Linux 设备上跑推理。LM Studio 提供 GPU 加速支持(CUDA/Metal/Vulkan),用户可以更灵活地控制上下文长度和量化精度。

解决什么问题

传统 dense 模型(如 Qwen2.5-32B)在本地部署时需要 60GB+ 显存,即使量化后也难以在消费级显卡(RTX 3090 24GB、RTX 4070 12GB)上流畅运行。Qwen3.5-35B-A3B 的 MoE 架构通过稀疏激活机制,让激活参数缩减至 3.5B,使得在 16-24GB 显存条件下运行成为可能。

这解决了三大人群的核心痛点:

参考来源
  1. Qwen3.5-35B-A3B 已上线 LM Studio · 2026-02-25
  2. Qwen2.5 技术博客 · 2024-09-19
  3. LM Studio 官方文档 · 2026-01-01
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。