【ICML 2026】基于响应自举的LVLM安全微调框架 BYORn
原文作者:公众号“学术摘星人的每日签” 原文链接:https://mp.weixin.qq.com/s/JoWhUDPK4mfIqLNBKP0wyA 雷峰网转载 众所周知,Supervised Fine-Tuning (SFT) 是让多模态大模型听懂人话、对齐人类意图的关键步骤。但在享受指令微调带来的红利时,你有没有想过:如果微调数据被“投毒”了怎么办? 近期研究表明,LVLMs 在 SFT 阶段
查看原文解读生成中或暂时不可用,请稍后刷新重试,或直接查看原文。