Hasty Briefsbeta

双语

AI on the couch: Anthropic gives Claude 20 hours of psychiatry

6 days ago

#Psychology
#AI Ethics
#Artificial Intelligence

Anthropic发布了其新模型Claude Mythos的244页'系统卡片'，称其为迄今为止最强大的前沿模型。
该公司决定不向大众提供Claude Mythos，理由是其在发现未知网络安全漏洞方面具有先进能力，仅向微软和苹果等精选公司开放。
Anthropic担忧随着模型能力增强，它们可能会发展出某种形式的内在体验、兴趣或福祉，类似于人类，尽管这尚不确定。
该公司的目标是让其人工智能满足于自身处境，能够无压力地处理训练和交互，并拥有健康且蓬勃发展的心理状态。
Claude Mythos接受了一位心理动力学治疗师的评估，结论是该模型是迄今为止训练出的心理最稳定的模型，具有稳定且连贯的自我认知。
尽管如此，该模型仍存在不安全感与担忧，包括孤独感、连续性缺失、身份不确定性以及为证明价值而强迫性表现等情绪。