成果分享 | 基于注意力汇聚的多模态大语言模型幻觉攻击 复旦白泽战队 1 day 6 hours ago 今天分享我实验室白泽智能被计算机安全领域顶级会议USENIX2025录用的最新研究 Mirage in the Eyes,该工作提出了一种仅利用注意力汇聚行为来触发MLLMs产生幻觉内容的新型攻击方法,攻破多款开源、商用模型并保持其隐蔽性。
成果分享 | 频域视角下的时间序列分类模型后门攻击研究 复旦白泽战队 1 week 6 days ago 我实验室白泽智能的近期研究成果基于频域的增强型攻击,在多种下游任务和模型上均取得优于现有SOTA攻击方法的表现。目前该工作已被交叉综合领域顶级会议WWW2025录用。
2025 | 从“Hello, World!”到未来无限可能 复旦白泽战队 1 month 3 weeks ago 元旦如同一段全新的代码,每一行都是通往梦想的注解。用热爱定义变量,用努力赋值未来,愿新的一年,你能编译出属于自己的奇迹与成功!
成果分享 | Neural Dehydration:水印类型无关的通用黑盒模型水印移除攻击 复旦白泽战队 3 months ago 分享我实验室白泽智能团队被CCS2024 录用的最新研究 Neural Dehydration,该工作提出了一种与水印类型无关的通用移除攻击,成功破解了当下10款主流的黑盒模型水印,在保持目标模型可用性的同时,对数据的依赖性也极低。