电子科技大学 | 针对自定义LLM的指令后门攻击 安全学术圈 1 month 2 weeks ago 本文提出了针对使用自定义化的大语言模型应用的指令后门攻击,攻击者通过精心设计的提示在输入包含预定义触发器时控制自定义 LLM 的输出。
阿里巴巴团队 | 监督微调数据构成如何影响大型语言模型的能力 安全学术圈 1 month 3 weeks ago 本研究特别关注在SFT过程中,数学推理、代码生成和通用人类对齐能力这三者之间数据构成的相互作用。
香港科技大学 | 从大型语言模型中提取专门化代码能力的可行性研究 安全学术圈 1 month 3 weeks ago 本文探讨了对LLMs发起模仿攻击以提取其专门化代码能力(如“代码合成”和“代码翻译”)的可行性。
纽约大学 | Lost at C:关于大型语言模型代码助手安全影响的用户级研究 安全学术圈 1 month 4 weeks ago 本文提出了一种名为MH-Net的新型多视角异构图模型,通过将不同位数的流量比特聚合为多种类型的流量单元,构建多视角流量图,丰富了信息表达粒度,并提升了模型性能。
清华大学 | MH-Net:基于多视角异构图的加密流量分类方法 安全学术圈 1 month 4 weeks ago 本文提出了一种名为MH-Net的新型多视角异构图模型,通过将不同位数的流量比特聚合为多种类型的流量单元,构建多视角流量图,丰富了信息表达粒度,并提升了模型性能。
南洋理工大学| MASTERKEY:面向大语言模型聊天机器人的自动化越狱攻击方法 安全学术圈 2 months ago 本文的研究为理解和防御 LLM 越狱提供了新的视角,也提醒业界亟需更加透明且强健的防御机制,以提升 AI 安全与伦理的底线保障。
维尔茨堡大学 | MirageFlow:一种针对 Tor 的新型带宽膨胀攻击 安全学术圈 2 months ago MirageFlow通过动态分配中继集群的共享资源,显著提升Tor带宽膨胀攻击效率。C-MirageFlow和D-MirageFlow分别实现近n倍和n×N/2倍膨胀,理论证明仅需10台服务器即可控制Tor网络50%流量。
Megagon Labs|面向LLM时代全尺寸现代知识图谱的精确检索基准CYPHERBENCH 安全学术圈 2 months 1 week ago 文中提出了在底层RDF图之上构建属性图视图,LLM可以使用Cypher查询语言高效地查询这些视图。
美国海军研究实验室|筑牢Tor网络实验中统计推理的根基 安全学术圈 2 months 1 week ago 本文系统性地提出了Tor网络实验中可靠统计推断的基础方法,结合新的网络建模、流量建模和仿真平台优化,实现了更大规模、更高效的实验。