← 返回资讯
产品发布 @ollama 2026-04-24

Ollama:即将在云端支持 DeepSeek-V4-Pro 与 V4-Flash

Ollama 宣布正在把 DeepSeek-V4-Pro 与 V4-Flash 接入 Ollama Cloud,后续用户可直接通过 Ollama 云端调用这两款新模型。

查看原文
TL;DR · 产品解读

Ollama 宣布将 DeepSeek-V4-Pro 与 V4-Flash 纳入 Ollama Cloud,意味着这家以本地推理工具见长的公司正式向云端推理赛道扩张。模型尚未上线,定价策略未明,但 DeepSeek 系列一贯以高性价比冲击市场,Ollama Cloud 的入场可能给主流 API 提供商带来压力。

深度解读

产品是什么

Ollama 是本地大模型推理工具的代表项目,支持一键拉取和运行开源模型,覆盖 Llama、Mistral、Qwen 等主流系列。此次公告意味着 DeepSeek-V4-Pro(旗舰级)与 V4-Flash(轻量快速版)两款模型将被集成进 Ollama Cloud,供用户直接通过 API 调用,省去自托管的算力与运维成本。

DeepSeek-V4 系列定位为 MoE(混合专家)架构的大语言模型,前代 V3 以接近 GPT-4o 级别表现、但显著更低的训练成本引发行业震动。V4-Pro 预计延续高推理能力路线,V4-Flash 则面向低延迟、批量任务场景。

解决什么问题

DeepSeek 模型此前的主要痛点在于:官方 API 区域限制、调用延迟不稳定、部分用户偏好独立供应商的 SLA 保障。Ollama Cloud 的出现填补了两个空白:一是 Ollama 本地用户可以直接在云端弹性扩容,无需重构代码;二是对 DeepSeek 品牌有信任度的企业用户多了一个具备开源生态背景的托管渠道。

定价与可用性

截至发稿,Ollama 尚未公布 V4 系列在 Ollama Cloud 的具体定价。参考 Ollama 现有云端定价(部分模型按 token 计费),V4-Flash 大概率走低价批量

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Ollama 宣布 DeepSeek-V4 接入云端 · 2026-04-24
  2. DeepSeek-V3 技术报告 · 2024-12
  3. Ollama Cloud 官方定价页 · 2026-04
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。