币圈界报道:

Anthropic推动高阶AI治理:构建全链条安全与韧性体系

该公司在最新发布的“AI指数政策”中,系统性提出覆盖先进模型开发与社会影响的双轨治理方案,强调政府应具备干预危险部署的能力,并建立可执行的监管路径。

强化政府干预权以应对技术跃迁

为弥补政策滞后于技术演进的缺口,Anthropic主张赋予监管机构在关键时刻叫停或威慑高危模型发布的法定权限。该机制将结合全球营收设定民事处罚标准,重复违规者将面临更高成本。所有前沿模型在对外发布前须完成强制性测试,并提交包含系统卡、安全架构与摘要在内的完整披露文件。

设立独立审查机制保障评估公信力

框架要求每家开发者至少引入一名经认证的第三方评估机构,负责复核其内部风险报告并出具独立意见。这些机构需获得访问核心模型数据的权限,并接受财政支持与行业标准规范。同时,开发者必须对训练环境实施纵深防御策略,防止外部入侵与内部滥用,且须公开基本安全设计逻辑,必要时向指定监管方提供补充材料。

界定高风险边界:计算量与经济规模双重门槛

拟议规则仅适用于达到特定阈值的系统——即训练计算量突破10²⁵次浮点运算,或年收入超过5亿美元的AI企业,以及研发投入逾10亿美元的研发实体。四大关键风险领域被明确列出:生物安全威胁、网络漏洞挖掘、系统失控可能,以及自动化研究引发的连锁反应。其中,生物风险包括利用模型加速病原体设计,而网络风险则指向对医疗系统、电力网络等基础设施构成的潜在攻击能力。

构建抵御灾难性后果的国家韧性机制

在公共层面,提案倡导建立多维度防护体系:生物方面包括基因合成筛查、早期疫情预警、防护物资储备及空气传播抑制工具;网络方面则聚焦软件供应链安全、关键设施加固与老旧系统淘汰。政府应设立专门职能单位追踪前沿能力发展动态,并推动政企协同开展模型防护能力建设。目前,对于失控与自动化研究风险的应对手段仍显不足,亟需研发更高效的检测、阻断与关停机制。