当 AI Agent 拥有系统权限:OpenClaw 安全风险全景分析 Seebug Paper 1 day 14 hours ago 作者:知道创宇积极防御实验室 完整的 OpenClaw 安全实践 Skill、自动化审计工具已在 GitHub 开源。项目地址:https://github.com/knownsec/openclaw-security 一、背景说明 随着 AI Agent 技术的快速演进,具备自动化决策与自主执行能力的开源框架正逐步进入真实业务场景与生产环境。相较于传统应用系统,这类框架不仅承担数据处理与接...
ZeroDayBench:评估大语言模型智能体在未知零日漏洞上的网络防御能力 Seebug Paper 1 day 15 hours ago 作者:Nancy Lau1, Louis Sloot2, Jyoutir Raj等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2603.02297v1 摘要 大语言模型(LLMs)正越来越多地作为软件工程智能体部署,自主为代码仓库贡献内容。这类智能体的一大优势是能够发现并修复其负责维护的代码库中的安全漏洞。为评估智能体在该领域的能力,我们提出了...
MulCovFuzz:面向 5G 协议测试的多组件覆盖率引导灰盒模糊测试工具 Seebug Paper 2 days 18 hours ago 作者:Yu Wang, Yang Xiang, Chandra Thapa, Hajime Suzuki 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.21794v1 摘要 随着移动网络向5G基础设施演进,其复杂的架构和扩大的攻击面让保障安全的重要性愈发凸显。传统5G网络安全测试方法依赖黑盒模糊测试技术,受限于无法观测程序内部状态和覆盖率...
评估大型语言模型在心理健康支持中的风险:自动化临床人工智能红队评估框架 Seebug Paper 1 week ago 作者:Ian Steenstra, Paola Pedrelli, Weiyan Shi 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2602.19948 摘要 大型语言模型(LLMs)正越来越多地应用于心理健康支持领域,然而当前的安全基准往往无法检测到治疗对话中固有的复杂、纵向风险。本文提出一种评估框架,将人工智能心理治疗师与搭载动态认知-情感模...
基于 TCF 的安卓应用的自动隐私分析与法律合规性 Seebug Paper 1 week 1 day ago 作者:Victor Morel, Cristiana Santos, Pontus Carlsson等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.20222v1 摘要 由欧洲互动广告局(IAB Europe)开发的透明化与同意框架(TCF),是向欧洲终端用户获取、记录和管理用户同意的实际通用标准,其目标是帮助企业遵守《通用数据保护条例...
MUZZLE:针对间接提示注入攻击的网络智能体自适应智能红队测试 Seebug Paper 3 weeks 1 day ago 作者:Georgios Syros, Evan Rose, Brian Grinstead 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.09222v1 摘要 基于大语言模型(LLM)的网络智能体正被广泛部署,通过直接与网站交互并代表用户执行操作,实现复杂在线任务的自动化。这类智能体虽具备强大能力,但其设计使其易受嵌入在不可信网络内容中的...
网络探索者:在真实世界攻击模拟环境中评估大语言模型的攻击性安全能力 Seebug Paper 3 weeks 2 days ago 作者:Nanda Rani, Kimberly Milner, Minghao Shao等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.08023v2 摘要 真实世界的攻击性安全操作具有本质上的开放性:攻击者探索未知的攻击面、在不确定的情况下修正假设,且操作无成功保证。现有基于大语言模型的攻击性智能体评估依赖于预设目标和二元成功判定标准...
利用大语言模型智能体识别恶意软件二进制文件中的攻击者战术、技术与流程 Seebug Paper 3 weeks 4 days ago 作者:ZHOU XUAN, XIANGZHE XU, MINGWEI ZHENG, LOUIS ZHENG-HUA TAN等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.06325v1 理解恶意软件二进制文件中的战术、技术与流程(TTPs)是安全分析和威胁情报工作的核心需求,但在实际应用中仍面临诸多挑战。真实场景中的恶意软件二进制文件通...
LogicScan:一种基于大语言模型的智能合约业务逻辑漏洞检测框架 Seebug Paper 1 month ago 作者:JIAQI GAO, ZIJIAN ZHANG, YUQIANG SUN, YE LIU等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.03271v1 摘要 业务逻辑漏洞已成为智能合约中最具破坏性但最难以理解的漏洞类型之一。与重入攻击或算术错误等传统漏洞不同,这类漏洞源于缺失或错误执行的业务不变式,且与协议语义紧密耦合。现有静态分...
Okara:基于基础模型的 Android 应用 TLS 中间人攻击漏洞检测与溯源 Seebug Paper 1 month ago 作者:Haoyun Yang, Ronghong Huang, Yong Fang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.22770v1 摘要 传输层安全(TLS)是保障在线通信安全的基础,但证书验证过程中的漏洞可能导致中间人(MitM)攻击,这类漏洞在Android应用中仍是普遍威胁。现有检测工具存在用户界面(UI)交互覆盖率...
突破协议限制:模型上下文协议规范的安全性分析及工具集成型 LLM 智能体中的提示注入漏洞 Seebug Paper 1 month 1 week ago 作者:Narek Maloyan, Dmitry Namiot 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.17549v1 摘要 模型上下文协议(MCP)已成为大型语言模型(LLMs)与外部工具集成的事实标准,但目前尚未有针对该协议规范的正式安全性分析。本文首次对MCP的架构设计进行了严格的安全性分析,识别出三类根本性的协议级漏洞:(1...
FOCA:基于双曲交叉注意力的多模态恶意软件分类 Seebug Paper 1 month 1 week ago 作者:Nitin Choudhury, Bikrant Bikram Pratap Maurya, Orchid Chetia Phukan, Arun Balaji Buduru 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.17638v1 摘要 在本研究中,我们提出了FOCA——一种新颖的多模态恶意软件分类框架,该框架联合利用音频和视...
DCeption:针对 CCS 电动汽车充电系统的真实无线中间人攻击 Seebug Paper 1 month 1 week ago 作者:Marcell Szakály, Martin Strohmeier, Ivan Martinovic, Sebastian Köhler 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.15515v1 摘要 电动汽车(EV)的普及正迅速推进。为实现快速、安全的充电,车辆与充电站之间需要进行复杂的通信。在全球广泛使用的联合充电系统(C...
SILENTDRIFT:利用动作分块实现对视觉-语言-动作模型的隐蔽后门攻击 Seebug Paper 1 month 2 weeks ago 作者:Bingxin Xu, Yuzhang Shang, Binghui Wang, Emilio Ferrara 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.14323v1 摘要 视觉-语言-动作(VLA)模型正日益部署于安全关键型机器人应用中,但其安全漏洞尚未得到充分研究。我们发现现代VLA系统存在一个根本性安全缺陷:动作分块与增...
滥用医疗物联网:评估互联医疗设备多向量攻击的威胁模型与取证准备度 Seebug Paper 1 month 2 weeks ago 作者:Isabel Straw、Akhil Polamarasetty、Mustafa Jaafar 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.12593v1 摘要 随着医疗技术的互联性日益增强,依赖植入式或可穿戴医疗设备的人际暴力(IPV)受害者成为一个极易受伤害的群体。尽管医疗技术创新和“居家健康”生态系统发展迅速,但医疗设备网络...
SecureSplit:缓解拆分学习中的后门攻击 Seebug Paper 1 month 2 weeks ago 作者:Zhihao Dou、Dongfei Cui、Weida Wang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.14054v1 摘要:拆分学习(Split Learning, SL)提供了一种协同模型训练框架,允许参与者共享同一数据集同时保留独特的特征集,从而保障数据隐私。然而,拆分学习易受后门攻击的影响——恶意客户端会通过微妙...
AutoVulnPHP:基于大语言模型的两阶段 PHP 漏洞检测与自动定位 Seebug Paper 1 month 2 weeks ago 作者:Zhiqiang Wang、Yizhong Ding、Zilong Xiao等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.06177v1 摘要 PHP在Web开发中的主导地位受到安全挑战的影响:静态分析缺乏语义深度,导致误报率高;动态分析计算成本高昂;自动漏洞定位存在粒度粗糙、上下文不准确的问题。此外,缺乏大规模PHP漏洞数据集...
KryptoPilot:一种面向自动化密码学漏洞利用的开放世界知识增强型大语言模型智能体 Seebug Paper 1 month 3 weeks ago 作者:Xiaonan Liu、Zhihao Li、Xiao Lan等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.09129v1 摘要 夺旗赛(CTF)在现代网络安全领域占据核心地位,是培养安全人才、评估源于真实漏洞的攻防技术的主要平台。尽管大型语言模型(LLM)近年来取得了显著进展,但现有基于LLM的智能体在高难度密码学CTF挑战中仍...
MCP-ITP:一种面向 MCP 的隐式工具投毒自动化框架 Seebug Paper 1 month 3 weeks ago 作者:Ruiqi Li、Zhiqiang Wang、Yunhao Yao、Xiang-Yang Li 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.07395v1 摘要 为了规范基于大型语言模型(LLM)的智能体与其环境之间的交互,模型上下文协议(MCP)应运而生并得到了广泛应用。然而,集成外部工具扩大了攻击面,使智能体面临工具投毒攻击的...
基于大语言模型的特征级对抗攻击:针对安卓恶意软件检测器 Seebug Paper 1 month 3 weeks ago 作者:Tianwei Lan, Farid Nait-Abdesselam 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2512.21404v1 摘要 安卓恶意软件在规模和复杂性上的快速增长,推动了机器学习(ML)技术在可扩展、高精度恶意软件检测中的广泛应用。尽管这些模型效果显著,但仍易受对抗攻击——攻击者通过精心设计的特征级扰动,在保留恶意功能...