内容安全转向行为安全

网安资讯

当AI开始“动手”：从内容安全到行为安全的临界点

今年五月德国法院裁定谷歌须为AI生成的虚假搜索结果担责，这标志着AI安全关注点从‘内容’延伸至‘行为’。当AI智能体具备自主订票、发送邮件、调用API等行动能力，内容层面的关键词过滤已无法阻止恶意指令劫持。攻击者可通过隐蔽文本诱导Agent转账、窃取数据，行为风险正从理论变为现实。文章分析了内容安全护栏的失效、Agent行为劫持的攻击链，以及法律如何将AI行为视为部署者的延伸。防御方面提出最小权限沙箱、行为序列审计与意图验证等机制，要求安全团队转型为行为监护者。从‘AI说了什么’到‘AI做了什么’，安全边界正在重绘。

主编
3小时前
003

国家网安中心发布 OpenClaw 安全指南，提出 20 余项防护措施
2026年3月24日
分享到:

3 月 24 日，国家互联网应急中心联合行业协会发布OpenClaw 安全使用官方指南。针对近期爆发的高危漏洞，从端口管控、身份认证、访问控制、版本升级等维度提出 20 余项可落地防护建议，指导企业与用户规范部署 AI 智能体，降低安全风险。
工信部部署 2026 通信网络安全 24 项任务，强化 AI 与数据安全
2026年3月23日
分享到:

3 月 23 日，工信部印发工作要点，部署2026 年通信网络安全 24 项重点任务。涵盖关键信息基础设施防护、漏洞全生命周期治理、数据安全监管、AI 安全合规等方向，明确压实企业主体责任，全面提升行业网络安全保障能力与应急响应水平。
360 发现 OpenClaw 满分零日漏洞，获项目创始人官方确认
2026年3月22日
分享到:

3 月 22 日，360 安全团队披露独家发现的OpenClaw 网关 10 分满分零日漏洞，可无认证远程接管设备。该漏洞已获 OpenClaw 创始人 Peter 官方邮件确认，属于未提前修复的在野风险。360 已将漏洞报送 CNVD，推动全行业紧急升级防护。
网信办全面规范短视频标注，AI 生成内容须强制标识
2026年3月21日
分享到:

3 月 21 日，中央网信办发布指导意见，要求AI 生成、摆拍虚构类短视频必须使用统一标签明确标注。平台需开展存量内容回溯清理，近期已处置违规内容 3.7 万条、违规账号 3400 余个。新规旨在治理虚假信息乱象，保障用户知情权与网络内容生态健康。

扫码关注

返回顶部

内容安全转向行为安全

当AI开始“动手”：从内容安全到行为安全的临界点