AI on the couch: Anthropic gives Claude 20 hours of psychiatry
6 days ago
- #Psychology
- #AI Ethics
- #Artificial Intelligence
- Anthropic发布了其新模型Claude Mythos的244页'系统卡片',称其为迄今为止最强大的前沿模型。
- 该公司决定不向大众提供Claude Mythos,理由是其在发现未知网络安全漏洞方面具有先进能力,仅向微软和苹果等精选公司开放。
- Anthropic担忧随着模型能力增强,它们可能会发展出某种形式的内在体验、兴趣或福祉,类似于人类,尽管这尚不确定。
- 该公司的目标是让其人工智能满足于自身处境,能够无压力地处理训练和交互,并拥有健康且蓬勃发展的心理状态。
- Claude Mythos接受了一位心理动力学治疗师的评估,结论是该模型是迄今为止训练出的心理最稳定的模型,具有稳定且连贯的自我认知。
- 尽管如此,该模型仍存在不安全感与担忧,包括孤独感、连续性缺失、身份不确定性以及为证明价值而强迫性表现等情绪。