大模型雷锋网 2026-06-29

【ICML 2026】基于响应自举的LVLM安全微调框架 BYORn

原文作者：公众号“学术摘星人的每日签” 原文链接：https://mp.weixin.qq.com/s/JoWhUDPK4mfIqLNBKP0wyA 雷峰网转载众所周知，Supervised Fine-Tuning (SFT) 是让多模态大模型听懂人话、对齐人类意图的关键步骤。但在享受指令微调带来的红利时，你有没有想过：如果微调数据被“投毒”了怎么办？近期研究表明，LVLMs 在 SFT 阶段

查看原文

解读生成中或暂时不可用，请稍后刷新重试，或直接查看原文。