← 返回资讯
大模型 HuggingFace Daily Papers 2026-06-30

TACO:面向智能体工具使用的增强信用优化方法

TACO:面向智能体工具使用的增强信用优化方法

TACO 通过双重优势通道区分有用、冗余或误导性代码操作来提升多模态智能体性能,包括用于单个工具贡献的差异答案探测奖励和用于最终结果分配的成果门控优势路由。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。