← 返回资讯
大模型 HuggingFace Daily Papers 2026-07-03

AnyGroundBench:视觉-语言模型视频定位专用领域基准

AnyGroundBench:视觉-语言模型视频定位专用领域基准

视觉-语言模型在专业时空视频定位任务中面临领域适应挑战,暴露出零样本泛化和上下文学习能力的局限性。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。