当 AI Agent 拥有系统权限:OpenClaw 安全风险全景分析 Seebug Paper 1 month 2 weeks ago 作者:知道创宇积极防御实验室 完整的 OpenClaw 安全实践 Skill、自动化审计工具已在 GitHub 开源。项目地址:https://github.com/knownsec/openclaw-security/https://github.com/knownsec/openclaw-security 一、背景说明 随着 AI Agent 技术的快速演进,具备自动化决策与自主执行能力的开源...
ZeroDayBench:评估大语言模型智能体在未知零日漏洞上的网络防御能力 Seebug Paper 1 month 2 weeks ago 作者:Nancy Lau1, Louis Sloot2, Jyoutir Raj等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2603.02297v1/https://arxiv.org/html/2603.02297v1 摘要 大语言模型(LLMs)正越来越多地作为软件工程智能体部署,自主为代码仓库贡献内容。这类智能体的一大优势是能够发现并修复其负...
MulCovFuzz:面向 5G 协议测试的多组件覆盖率引导灰盒模糊测试工具 Seebug Paper 1 month 2 weeks ago 作者:Yu Wang, Yang Xiang, Chandra Thapa, Hajime Suzuki 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.21794v1 摘要 随着移动网络向5G基础设施演进,其复杂的架构和扩大的攻击面让保障安全的重要性愈发凸显。传统5G网络安全测试方法依赖黑盒模糊测试技术,受限于无法观测程序内部状态和覆盖率...
MulCovFuzz:面向 5G 协议测试的多组件覆盖率引导灰盒模糊测试工具 Seebug Paper 1 month 2 weeks ago 作者:Yu Wang, Yang Xiang, Chandra Thapa, Hajime Suzuki 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.21794v1/https://arxiv.org/html/2602.21794v1 摘要 随着移动网络向5G基础设施演进,其复杂的架构和扩大的攻击面让保障安全的重要性愈发凸显。传统5G网络安...
评估大型语言模型在心理健康支持中的风险:自动化临床人工智能红队评估框架 Seebug Paper 1 month 2 weeks ago 作者:Ian Steenstra, Paola Pedrelli, Weiyan Shi 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2602.19948 摘要 大型语言模型(LLMs)正越来越多地应用于心理健康支持领域,然而当前的安全基准往往无法检测到治疗对话中固有的复杂、纵向风险。本文提出一种评估框架,将人工智能心理治疗师与搭载动态认知-情感模...
评估大型语言模型在心理健康支持中的风险:自动化临床人工智能红队评估框架 Seebug Paper 1 month 2 weeks ago 作者:Ian Steenstra, Paola Pedrelli, Weiyan Shi 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2602.19948 摘要 大型语言模型(LLMs)正越来越多地应用于心理健康支持领域,然而当前的安全基准往往无法检测到治疗对话中固有的复杂、纵向风险。本文提出一种评估框架,将人工智能心理治疗师与搭载动态认知-情感模型的模...
基于 TCF 的安卓应用的自动隐私分析与法律合规性 Seebug Paper 1 month 3 weeks ago 作者:Victor Morel, Cristiana Santos, Pontus Carlsson等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.20222v1 摘要 由欧洲互动广告局(IAB Europe)开发的透明化与同意框架(TCF),是向欧洲终端用户获取、记录和管理用户同意的实际通用标准,其目标是帮助企业遵守《通用数据保护条例...
基于 TCF 的安卓应用的自动隐私分析与法律合规性 Seebug Paper 1 month 3 weeks ago 作者:Victor Morel, Cristiana Santos, Pontus Carlsson等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.20222v1/https://arxiv.org/html/2602.20222v1 摘要 由欧洲互动广告局(IAB Europe)开发的透明化与同意框架(TCF),是向欧洲终端用户获取、记录和...
MUZZLE:针对间接提示注入攻击的网络智能体自适应智能红队测试 Seebug Paper 2 months 1 week ago 作者:Georgios Syros, Evan Rose, Brian Grinstead 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.09222v1 摘要 基于大语言模型(LLM)的网络智能体正被广泛部署,通过直接与网站交互并代表用户执行操作,实现复杂在线任务的自动化。这类智能体虽具备强大能力,但其设计使其易受嵌入在不可信网络内容中的...
MUZZLE:针对间接提示注入攻击的网络智能体自适应智能红队测试 Seebug Paper 2 months 1 week ago 作者:Georgios Syros, Evan Rose, Brian Grinstead 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.09222v1/https://arxiv.org/html/2602.09222v1 摘要 基于大语言模型(LLM)的网络智能体正被广泛部署,通过直接与网站交互并代表用户执行操作,实现复杂在线任务的自动化。...
网络探索者:在真实世界攻击模拟环境中评估大语言模型的攻击性安全能力 Seebug Paper 2 months 1 week ago 作者:Nanda Rani, Kimberly Milner, Minghao Shao等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.08023v2 摘要 真实世界的攻击性安全操作具有本质上的开放性:攻击者探索未知的攻击面、在不确定的情况下修正假设,且操作无成功保证。现有基于大语言模型的攻击性智能体评估依赖于预设目标和二元成功判定标准...
利用大语言模型智能体识别恶意软件二进制文件中的攻击者战术、技术与流程 Seebug Paper 2 months 1 week ago 作者:ZHOU XUAN, XIANGZHE XU, MINGWEI ZHENG, LOUIS ZHENG-HUA TAN等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.06325v1 理解恶意软件二进制文件中的战术、技术与流程(TTPs)是安全分析和威胁情报工作的核心需求,但在实际应用中仍面临诸多挑战。真实场景中的恶意软件二进制文件通...
LogicScan:一种基于大语言模型的智能合约业务逻辑漏洞检测框架 Seebug Paper 2 months 1 week ago 作者:JIAQI GAO, ZIJIAN ZHANG, YUQIANG SUN, YE LIU等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2602.03271v1 摘要 业务逻辑漏洞已成为智能合约中最具破坏性但最难以理解的漏洞类型之一。与重入攻击或算术错误等传统漏洞不同,这类漏洞源于缺失或错误执行的业务不变式,且与协议语义紧密耦合。现有静态分...
Okara:基于基础模型的 Android 应用 TLS 中间人攻击漏洞检测与溯源 Seebug Paper 2 months 2 weeks ago 作者:Haoyun Yang, Ronghong Huang, Yong Fang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.22770v1 摘要 传输层安全(TLS)是保障在线通信安全的基础,但证书验证过程中的漏洞可能导致中间人(MitM)攻击,这类漏洞在Android应用中仍是普遍威胁。现有检测工具存在用户界面(UI)交互覆盖率...
突破协议限制:模型上下文协议规范的安全性分析及工具集成型 LLM 智能体中的提示注入漏洞 Seebug Paper 2 months 3 weeks ago 作者:Narek Maloyan, Dmitry Namiot 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.17549v1 摘要 模型上下文协议(MCP)已成为大型语言模型(LLMs)与外部工具集成的事实标准,但目前尚未有针对该协议规范的正式安全性分析。本文首次对MCP的架构设计进行了严格的安全性分析,识别出三类根本性的协议级漏洞:(1...
FOCA:基于双曲交叉注意力的多模态恶意软件分类 Seebug Paper 2 months 3 weeks ago 作者:Nitin Choudhury, Bikrant Bikram Pratap Maurya, Orchid Chetia Phukan, Arun Balaji Buduru 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.17638v1 摘要 在本研究中,我们提出了FOCA——一种新颖的多模态恶意软件分类框架,该框架联合利用音频和视...
DCeption:针对 CCS 电动汽车充电系统的真实无线中间人攻击 Seebug Paper 2 months 3 weeks ago 作者:Marcell Szakály, Martin Strohmeier, Ivan Martinovic, Sebastian Köhler 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.15515v1 摘要 电动汽车(EV)的普及正迅速推进。为实现快速、安全的充电,车辆与充电站之间需要进行复杂的通信。在全球广泛使用的联合充电系统(C...
SILENTDRIFT:利用动作分块实现对视觉-语言-动作模型的隐蔽后门攻击 Seebug Paper 2 months 4 weeks ago 作者:Bingxin Xu, Yuzhang Shang, Binghui Wang, Emilio Ferrara 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.14323v1 摘要 视觉-语言-动作(VLA)模型正日益部署于安全关键型机器人应用中,但其安全漏洞尚未得到充分研究。我们发现现代VLA系统存在一个根本性安全缺陷:动作分块与增...
滥用医疗物联网:评估互联医疗设备多向量攻击的威胁模型与取证准备度 Seebug Paper 2 months 4 weeks ago 作者:Isabel Straw、Akhil Polamarasetty、Mustafa Jaafar 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.12593v1 摘要 随着医疗技术的互联性日益增强,依赖植入式或可穿戴医疗设备的人际暴力(IPV)受害者成为一个极易受伤害的群体。尽管医疗技术创新和“居家健康”生态系统发展迅速,但医疗设备网络...
SecureSplit:缓解拆分学习中的后门攻击 Seebug Paper 2 months 4 weeks ago 作者:Zhihao Dou、Dongfei Cui、Weida Wang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2601.14054v1 摘要:拆分学习(Split Learning, SL)提供了一种协同模型训练框架,允许参与者共享同一数据集同时保留独特的特征集,从而保障数据隐私。然而,拆分学习易受后门攻击的影响——恶意客户端会通过微妙...