大模型 @deepseek_ai 2026-04-24

DeepSeek：V4 引入 DSA 稀疏注意力，1M 上下文成官方默认

DeepSeek-V4 采用 token-wise 压缩与新型稀疏注意力 DSA（DeepSeek Sparse Attention），在大幅降低算力与显存开销的同时，所有官方服务默认支持 1M 超长上下文。

本解读由 AI 自动生成 · 模板：事件解读 · 仅供参考，请以原文为准。