LLMs Predict My Coffee
2 months ago
- #LLMs
- #Physics
- #Experiments
- 测试了大型语言模型预测陶瓷杯中沸水随时间温度下降的能力。
- 实验将8盎司沸水倒入初始温度为20°C、重1.25磅的杯子中。
- 多种物理现象影响冷却过程:传导、对流、蒸发、辐射等。
- 大型语言模型基于指数衰减项提供了方程,但准确度参差不齐。
- Claude 4.6 Opus表现最佳但成本高昂(token费用达0.61美元)。
- 实验结果显示初期冷却比模型预测更快,后期冷却更慢。
- 所有模型预测都基于一个或两个指数衰减项。
- 部分模型(DeepSeek、Grok)虽收取服务费却未能给出答案。