Think of a Number
a year ago
- #AI
- #Mathematics
- #AGI
- Sam Altman关于AGI即将到来的说法被批评为不负责任的炒作。
- 当前AI能处理本科数学题,但在博士水平任务上失败,表明尚无真正的AGI。
- 作者提议建立一个秘密的数论难题数据库来测试AI的数学理解能力。
- 问题需满足:答案为非负整数、难度超越本科水平、无法轻易猜测或在线搜索到。
- 该实验旨在区分AI的模式匹配能力与真正的数学思维。
- 作者寻求博士级数论学者合作贡献高难度问题。
- 将邀请AI公司用其模型测试该数据库,结果会公开。
- 与FrontierMath不同,本项目确保问题未被AI模型预先接触。
- 示例问题类似FrontierMath,但难度更高且分布更均匀。
- 最终目标是评估AI能否真正进行数学思考,而非随机鹦鹉学舌。