DeepSeek 天才少女罗福莉开始发推,分享 Agent 实践心得
传闻中被雷军千万年薪挖角的 DeepSeek 研究员罗福莉首次在推特发文,分享 MiMo 团队使用 Agent 系统的经验,透露 1T 底座模型采用混合注意力机制支持百万 token 上下文。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
传闻中被雷军千万年薪挖角的 DeepSeek 研究员罗福莉首次在推特发文,分享 MiMo 团队使用 Agent 系统的经验,透露 1T 底座模型采用混合注意力机制支持百万 token 上下文。
查看原文