Reasoning Models Can Be Effective Without Thinking
a year ago
- #Artificial Intelligence
- #LLMs
- #Reasoning Models
- 最新的大语言模型通过显式思维过程生成,显著提升了推理能力。
- 该论文质疑显式思维的必要性,研究表明绕过该过程(无思维模式)同样有效。
- 在七个推理数据集测试中,无思维模式全面超越显式思维模式,在低计算资源场景下优势尤为显著。
- 随着采样次数k值增加,无思维模式的pass@k指标表现愈发具有竞争力。
- 研究提出并行扩展方案:通过无思维模式独立生成N个输出后进行聚合,效果极佳。
- 该方法在相同延迟条件下超越基线模型,与延迟高达9倍的显式思维模式性能相当。
- 这项研究促使学界重新审视:要实现强大推理性能,冗长的思维过程是否确有必要。