作者:Justin W. Lin, Eliot Krzysztof Jones等
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/html/2512.09882
摘要
我们首次在真实企业环境中对人工智能代理与人类网络安全专业人员进行了全面评估。我们在一个包含12个子网、约8000台主机的大型大学网络中,对10名网络安全专业人员、6个现有人工智能代理以及我们新开...
作者:P. Bisconti, M. Prandi, F. Pierucci, F. Giarrusso等
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/html/2511.15304v2
摘要
本文证实,对抗性诗歌可作为大型语言模型(LLMs)的通用单轮越狱技术。在25个前沿的专有模型和开源权重模型中,精心设计的诗歌提示词实现了较高的攻击成功率(ASR),...