AI安全的里程碑：NIST发布基础模型滥用风险管理指南

在人工智能技术迅猛发展的今天，AI的安全性和可靠性成为了全球关注的焦点。2023年10月30日，美国总统拜登签署了行政命令14110，旨在推动安全、可靠和值得信赖的人工智能的发展。作为对该行政命令的响应，美国国家标准与技术研究院（NIST）于2024年7月26日发布了一份具有里程碑意义的文件——《NIST AI 800-1 ipd (Initial Public Draft) Managing Misuse Risk for Dual-Use Foundation Models》。这份文件不仅为AI风险管理提供了新的视角，也标志着全球AI治理进入了一个新的阶段。

1. 背景与意义

随着AI技术的广泛应用，其潜在的滥用风险也日益凸显。从促进大规模杀伤性武器的开发到支持网络攻击，再到生成有害内容，AI的双重用途特性使其在为人类带来便利的同时，也可能被用于恶意目的。因此，如何有效管理这些风险，确保AI技术的健康发展，成为了一个亟待解决的问题。

NIST发布的这份指南，正是在这样的背景下应运而生。它不仅为AI风险管理提供了一套具体的框架和方法，也为全球AI治理提供了重要的参考。这份指南的发布，体现了美国在推动负责任的AI发展和使用方面的领导地位，也为全球AI安全治理贡献了宝贵的经验。

2. 指南内容概述

这份指南由NIST的人工智能安全研究所（AISI）发布，旨在提供指导方针，以提高双重用途基础模型的安全性、安全性和可信度。它基于人工智能风险管理框架，确定了最佳实践，以映射、测量、管理和治理基础模型的滥用风险，并提供了组织如何透明地管理这些风险的方法。

2.1 滥用风险的关注点

指南重点关注了基础模型的滥用风险，这些模型表现出或可以被轻易修改以表现出在安全、经济安全、公共卫生或安全方面具有高风险性能。这包括但不限于以下几个方面：

– 降低非专家设计、合成、获取或使用化学、生物、放射性或核(CBRN)武器的门槛；

– 通过自动化漏洞发现和利用，支持网络攻击的强力进攻性网络操作；

– 允许通过欺骗或混淆手段规避人类控制或监督。

2.2 涉及的各方角色

文档的实践主要集中于基础模型的初始开发者，他们在模型供应链中扮演核心角色。除了初始开发者外，其他各方也在管理滥用风险中扮演重要角色，包括下游的开发者和部署者、第三方评估者和审计师、民间社会组织和政府机构。

3. 映射和测量滥用风险的关键挑战

在映射和测量滥用风险时，指南指出了面临的主要挑战，包括基础模型的广泛应用性、能力转换的不确定性、规模对性能影响的预测困难等。这些挑战增加了衡量或监控滥用风险的难度，也对风险管理提出了更高的要求。

4. 管理滥用风险的目标和实践

本节概述了七个目标，以及有助于实现这些目标的相关实践，供组织绘制、测量、管理和治理其基础模型被滥用以故意危害公共安全的风险。

4.1 预见潜在的滥用风险

组织应评估基础模型如果被恶意行为者获取可能被滥用的风险，包括在模型开发之前根据对其能力的估计来评估这些风险。识别最显著的预期风险，以便在必要时对其进行测量和管理。

4.2 制定滥用风险管理计划

为确保开发和部署计划与资源、时间和运营限制相匹配，同时符合法律或监管义务，并考虑到潜在的利益和其他相关因素，组织应确定可接受的滥用风险水平。

4.3 管理模型被非法获取的风险

为防止信息和资产被非法获取，避免恶意行为者能够重现基础模型，组织应采取相应措施。这在必要时对管理滥用风险至关重要。

4.4 测量滥用风险

在有合理评估认为基础模型可能被滥用的情况下，应测量预测风险，为模型在现实世界中的实际滥用风险提供证据。

4.5 确保在部署基础模型之前管理滥用风险

只有在滥用风险得到充分管理（包括至少在组织的风险承受范围内）时，才采取行动增加对模型的访问。

4.6 收集并响应部署后有关滥用的信息

收集有关已部署系统的信息，以提高对其滥用风险的理解，从而调整部署并改进未来的风险管理。

4.7 提供关于滥用风险的适当透明度

组织应向公众和相关实体提供在开发和部署基础模型过程中与滥用风险相关的透明度，以促进理解、问责、合作以及与模型滥用相关的科学发展。

5. 结论

NIST发布的这份指南，为AI风险管理提供了宝贵的指导，也为全球AI治理提供了重要的参考。它不仅体现了美国在推动负责任的AI发展和使用方面的领导地位，也为全球AI安全治理贡献了宝贵的经验。随着AI技术的不断发展，如何有效管理AI的滥用风险，确保AI技术的健康发展，将成为全球共同面临的挑战。这份指南的发布，无疑为我们提供了一个良好的起点。

在未来，我们期待更多的组织和国家能够参与到AI安全治理中来，共同推动AI技术的健康发展，为人类社会带来更多的福祉。同时，我们也需要不断地更新和完善AI风险管理的框架和方法，以应对不断变化的挑战和风险。只有这样，我们才能确保AI技术的安全、可靠和值得信赖，让AI真正成为推动人类进步的力量。