Hasty Briefsbeta

双语

Anthropic's Responsible Scaling Policy: Version 3.0

6 hours ago

#Responsible Scaling
#AI Safety
#Risk Mitigation

Anthropic发布《负责任扩展政策》(RSP)3.0版本以降低AI风险
RSP采用AI安全等级(ASL)机制，根据模型能力实施相应保障措施
初期ASL-2和ASL-3等级已明确定义，但更高级别ASL-4及以上尚未具体规范
该政策旨在建立内部问责机制、推动行业安全标准建设并形成AI风险共识
已取得成果包括强化保障措施、落实ASL-3标准，并影响其他企业及早期AI政策
面临挑战包括能力阈值模糊、政府行动迟缓及单边风险管控困难
新版RSP将企业规划与行业建议分离，引入前沿安全路线图，并强制要求通过外部审查的风险报告
风险报告将提供详细安全评估，并接受第三方审查以提升透明度
RSP将持续保持动态更新，以适应AI能力演进与风险变化