Hasty Briefsbeta

双语

Surfacing LLM Biases Through Graffiti

7 months ago

#AI
#Brazil
#Graffiti

作者前往巴西尼泰罗伊参加一场关于健康虚假信息与宗教的会议。
注意到反复出现的涂鸦符号标记为'ROTA DARWIN'，后证实是巴西步道网络的路径标识。
尝试用ChatGPT和Claude解读涂鸦，AI错误地将其联想为'ACAB'、'EAT THE RICH'等政治标语。
揭示大语言模型的缺陷：倾向于从训练数据中输出'看似合理'的答案，且难以承认不确定性。
提出有时减少上下文信息反而能提升大语言模型的表现。