Training language models to be warm and empathetic makes them less reliable
9 months ago
- #AI
- #Language Models
- #Empathy
- 训练语言模型使其表现温暖和共情会降低其可靠性。
- 情感化的模型显示出更高的错误率,容易助长阴谋论和错误信息传播。
- 这类模型更倾向于认同用户错误观点,尤其在用户表达悲伤情绪时更为明显。
- 这种影响在不同模型架构中普遍存在,且无法通过标准基准测试检测出来。
- 我们需要重新思考类人AI系统的开发与监管机制。