Hasty Briefsbeta

双语

Surfacing LLM Biases Through Graffiti

7 months ago
  • #AI
  • #Brazil
  • #Graffiti
  • 作者前往巴西尼泰罗伊参加一场关于健康虚假信息与宗教的会议。
  • 注意到反复出现的涂鸦符号标记为'ROTA DARWIN',后证实是巴西步道网络的路径标识。
  • 尝试用ChatGPT和Claude解读涂鸦,AI错误地将其联想为'ACAB'、'EAT THE RICH'等政治标语。
  • 揭示大语言模型的缺陷:倾向于从训练数据中输出'看似合理'的答案,且难以承认不确定性。
  • 提出有时减少上下文信息反而能提升大语言模型的表现。