Ollama:即将在云端支持 DeepSeek-V4-Pro 与 V4-Flash
Ollama 宣布正在把 DeepSeek-V4-Pro 与 V4-Flash 接入 Ollama Cloud,后续用户可直接通过 Ollama 云端调用这两款新模型。
查看原文Ollama 宣布将 DeepSeek-V4-Pro 与 V4-Flash 纳入 Ollama Cloud,意味着这家以本地推理工具见长的公司正式向云端推理赛道扩张。模型尚未上线,定价策略未明,但 DeepSeek 系列一贯以高性价比冲击市场,Ollama Cloud 的入场可能给主流 API 提供商带来压力。
产品是什么
Ollama 是本地大模型推理工具的代表项目,支持一键拉取和运行开源模型,覆盖 Llama、Mistral、Qwen 等主流系列。此次公告意味着 DeepSeek-V4-Pro(旗舰级)与 V4-Flash(轻量快速版)两款模型将被集成进 Ollama Cloud,供用户直接通过 API 调用,省去自托管的算力与运维成本。
DeepSeek-V4 系列定位为 MoE(混合专家)架构的大语言模型,前代 V3 以接近 GPT-4o 级别表现、但显著更低的训练成本引发行业震动。V4-Pro 预计延续高推理能力路线,V4-Flash 则面向低延迟、批量任务场景。
解决什么问题
DeepSeek 模型此前的主要痛点在于:官方 API 区域限制、调用延迟不稳定、部分用户偏好独立供应商的 SLA 保障。Ollama Cloud 的出现填补了两个空白:一是 Ollama 本地用户可以直接在云端弹性扩容,无需重构代码;二是对 DeepSeek 品牌有信任度的企业用户多了一个具备开源生态背景的托管渠道。
定价与可用性
截至发稿,Ollama 尚未公布 V4 系列在 Ollama Cloud 的具体定价。参考 Ollama 现有云端定价(部分模型按 token 计费),V4-Flash 大概率走低价批量
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- Ollama 宣布 DeepSeek-V4 接入云端 · 2026-04-24
- DeepSeek-V3 技术报告 · 2024-12
- Ollama Cloud 官方定价页 · 2026-04