← 返回资讯
大模型 @perplexity_ai 2026-05-20

Perplexity:上线查询感知上下文压缩,搜索更快更准

Perplexity 将查询感知的上下文压缩技术投入生产,系统在最多削减 70% 上下文 token 的同时提升答案质量,并强调「更好的上下文胜过更多的上下文」。

查看原文
TL;DR · 产品解读

Perplexity 将查询感知上下文压缩投入生产,削减 70% token 用量同时提升答案质量,主打「更少但更好」的上下文策略。对 API 开发者意味着成本下降,对普通用户意味着搜索更快更准。

深度解读

Perplexity 近日宣布已在生产环境中上线查询感知上下文压缩(Query-Aware Contextual Compression)技术。这一技术的核心逻辑是:在生成答案之前,系统先理解用户的真实查询意图,然后动态识别上下文中「与该查询相关」的内容,丢弃其余无关信息。

官方数据显示,这套机制最多可削减 70% 的上下文 token,同时答案质量反而有所提升。Perplexity 用一句话总结其理念:「更好的上下文,胜过更多的上下文(Better context beats more context)。」这实际上是对大模型「长上下文 = 高质量」主流范式的一次公开质疑。

技术路径解析

该技术的实现大致分为两个阶段:查询重写(Query Reformulation)动态上下文剪枝(Context Pruning)。前者将用户模糊的自然语言查询转化为结构化、明确的检索意图;后者根据该意图在原始上下文中做软性筛选,保留高度相关的段落。这种「先理解再压缩」的pipeline,区别于传统 RAG 的「先检索再拼装」。

对用户侧最直接的感知是:搜索延迟降低、回答速度加快;对 AP

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Perplexity 官方公告 · 2026-05-20
  2. OpenAI GPT-4o 产品页面 · 2025-05-13
  3. Anthropic Claude 3.5 Sonnet 发布说明 · 2024-06-20
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。