PerceptionDLM:多模态扩散语言模型中的并行区域感知
PerceptionDLM 通过结构化注意力掩码和高效提示,在多模态扩散语言模型中实现高效并行区域感知,推理速度更快且不牺牲字幕质量。
查看原文解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。
PerceptionDLM 通过结构化注意力掩码和高效提示,在多模态扩散语言模型中实现高效并行区域感知,推理速度更快且不牺牲字幕质量。
查看原文