← 返回资讯
大模型 HuggingFace Daily Papers 2026-06-25

IV-CoT:隐式视觉思维链改进文生图结构感知

IV-CoT将视觉条件分解为结构与语义两级级联,借助草图监督提升结构感知的图像生成效果。

查看原文
解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。