Hasty Briefsbeta

双语

Reasoning Models Can Be Effective Without Thinking

a year ago

#Artificial Intelligence
#LLMs
#Reasoning Models

最新的大语言模型通过显式思维过程生成，显著提升了推理能力。
该论文质疑显式思维的必要性，研究表明绕过该过程（无思维模式）同样有效。
在七个推理数据集测试中，无思维模式全面超越显式思维模式，在低计算资源场景下优势尤为显著。
随着采样次数k值增加，无思维模式的pass@k指标表现愈发具有竞争力。
研究提出并行扩展方案：通过无思维模式独立生成N个输出后进行聚合，效果极佳。
该方法在相同延迟条件下超越基线模型，与延迟高达9倍的显式思维模式性能相当。
这项研究促使学界重新审视：要实现强大推理性能，冗长的思维过程是否确有必要。