Is DeepSeek a New Voice Among LLMs in Public Opinion Simulation?
10 months ago
- #Public Opinion Simulation
- #LLM
- #Bias Mitigation
- 研究评估了DeepSeek与其他大语言模型(如Qwen2.5、GPT-4o和Llama-3.3)在模拟公众意见方面的能力对比
- DeepSeek-V3在模拟美国民众关于堕胎议题的立场时表现最佳,尤其是对民主党或自由派人设的模拟
- 针对中国样本,DeepSeek-V3在对外援助和个人主义议题的立场模拟上表现突出,但在资本主义观点上存在不足
- 所有大语言模型都存在对人口群体观点过度泛化的倾向,显示出高度一致的响应模式
- 研究结果凸显了需要缓解大语言模型在公众意见建模中存在的文化及人口统计偏见