iPhone 17 Pro 演示运行 4000 亿参数大模型
通过 Flash-MoE 引擎从 SSD 流式加载 400B 参数模型,速度约 0.6 token/秒,为技术可行性演示。HN 473 票。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
通过 Flash-MoE 引擎从 SSD 流式加载 400B 参数模型,速度约 0.6 token/秒,为技术可行性演示。HN 473 票。
查看原文