Anthropic's Responsible Scaling Policy: Version 3.0
6 hours ago
- #Responsible Scaling
- #AI Safety
- #Risk Mitigation
- Anthropic发布《负责任扩展政策》(RSP)3.0版本以降低AI风险
- RSP采用AI安全等级(ASL)机制,根据模型能力实施相应保障措施
- 初期ASL-2和ASL-3等级已明确定义,但更高级别ASL-4及以上尚未具体规范
- 该政策旨在建立内部问责机制、推动行业安全标准建设并形成AI风险共识
- 已取得成果包括强化保障措施、落实ASL-3标准,并影响其他企业及早期AI政策
- 面临挑战包括能力阈值模糊、政府行动迟缓及单边风险管控困难
- 新版RSP将企业规划与行业建议分离,引入前沿安全路线图,并强制要求通过外部审查的风险报告
- 风险报告将提供详细安全评估,并接受第三方审查以提升透明度
- RSP将持续保持动态更新,以适应AI能力演进与风险变化