大模型 @perplexity_ai 2026-05-20

Perplexity：上线查询感知上下文压缩，搜索更快更准

Perplexity 将查询感知的上下文压缩技术投入生产，系统在最多削减 70% 上下文 token 的同时提升答案质量，并强调「更好的上下文胜过更多的上下文」。

TL;DR · 产品解读

Perplexity 将查询感知上下文压缩投入生产，削减 70% token 用量同时提升答案质量，主打「更少但更好」的上下文策略。对 API 开发者意味着成本下降，对普通用户意味着搜索更快更准。

深度解读

Perplexity 近日宣布已在生产环境中上线查询感知上下文压缩（Query-Aware Contextual Compression）技术。这一技术的核心逻辑是：在生成答案之前，系统先理解用户的真实查询意图，然后动态识别上下文中「与该查询相关」的内容，丢弃其余无关信息。

官方数据显示，这套机制最多可削减 70% 的上下文 token，同时答案质量反而有所提升。Perplexity 用一句话总结其理念：「更好的上下文，胜过更多的上下文（Better context beats more context）。」这实际上是对大模型「长上下文 = 高质量」主流范式的一次公开质疑。

技术路径解析

该技术的实现大致分为两个阶段：查询重写（Query Reformulation）和动态上下文剪枝（Context Pruning）。前者将用户模糊的自然语言查询转化为结构化、明确的检索意图；后者根据该意图在原始上下文中做软性筛选，保留高度相关的段落。这种「先理解再压缩」的pipeline，区别于传统 RAG 的「先检索再拼装」。

对用户侧最直接的感知是：搜索延迟降低、回答速度加快；对 AP

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

Perplexity 官方公告 · 2026-05-20
OpenAI GPT-4o 产品页面 · 2025-05-13
Anthropic Claude 3.5 Sonnet 发布说明 · 2024-06-20

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。