Hasty Briefsbeta

双语

LLMs Get Lost in Multi-Turn Conversation

a year ago
  • #Multi-turn Conversations
  • #LLMs
  • #Conversational AI
  • 大语言模型(LLMs)是通过多轮对话帮助用户定义、探索和优化任务的交互界面。
  • 尽管用户指令经常存在定义不全的情况,但LLM评估主要集中于单轮、完全明确指令的场景。
  • 实验表明,LLMs在多轮对话中的表现显著差于单轮对话,在六项任务中平均性能下降39%。
  • 多轮对话中的性能下降源于轻微的能力损失和显著增加的不可靠性。
  • LLMs常在对话早期做出假设并过早生成最终解决方案,导致其无法自我纠正的错误。