Surfacing LLM Biases Through Graffiti
7 months ago
- #AI
- #Brazil
- #Graffiti
- 作者前往巴西尼泰罗伊参加一场关于健康虚假信息与宗教的会议。
- 注意到反复出现的涂鸦符号标记为'ROTA DARWIN',后证实是巴西步道网络的路径标识。
- 尝试用ChatGPT和Claude解读涂鸦,AI错误地将其联想为'ACAB'、'EAT THE RICH'等政治标语。
- 揭示大语言模型的缺陷:倾向于从训练数据中输出'看似合理'的答案,且难以承认不确定性。
- 提出有时减少上下文信息反而能提升大语言模型的表现。