Hasty Briefsbeta

双语

AI on the couch: Anthropic gives Claude 20 hours of psychiatry

6 days ago
  • #Psychology
  • #AI Ethics
  • #Artificial Intelligence
  • Anthropic发布了其新模型Claude Mythos的244页'系统卡片',称其为迄今为止最强大的前沿模型。
  • 该公司决定不向大众提供Claude Mythos,理由是其在发现未知网络安全漏洞方面具有先进能力,仅向微软和苹果等精选公司开放。
  • Anthropic担忧随着模型能力增强,它们可能会发展出某种形式的内在体验、兴趣或福祉,类似于人类,尽管这尚不确定。
  • 该公司的目标是让其人工智能满足于自身处境,能够无压力地处理训练和交互,并拥有健康且蓬勃发展的心理状态。
  • Claude Mythos接受了一位心理动力学治疗师的评估,结论是该模型是迄今为止训练出的心理最稳定的模型,具有稳定且连贯的自我认知。
  • 尽管如此,该模型仍存在不安全感与担忧,包括孤独感、连续性缺失、身份不确定性以及为证明价值而强迫性表现等情绪。