← 返回资讯
大模型 HuggingFace Daily Papers 2026-07-02

PerceptionRubrics:多模态评估的人类感知校准

PerceptionRubrics:多模态评估的人类感知校准

PerceptionRubrics提出基于评分标准的评估框架,通过原子审计和门控评分机制识别基准性能与实际表现的差距。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。