Hasty Briefsbeta

双语

Think of a Number

a year ago

#AI
#Mathematics
#AGI

Sam Altman关于AGI即将到来的说法被批评为不负责任的炒作。
当前AI能处理本科数学题，但在博士水平任务上失败，表明尚无真正的AGI。
作者提议建立一个秘密的数论难题数据库来测试AI的数学理解能力。
问题需满足：答案为非负整数、难度超越本科水平、无法轻易猜测或在线搜索到。
该实验旨在区分AI的模式匹配能力与真正的数学思维。
作者寻求博士级数论学者合作贡献高难度问题。
将邀请AI公司用其模型测试该数据库，结果会公开。
与FrontierMath不同，本项目确保问题未被AI模型预先接触。
示例问题类似FrontierMath，但难度更高且分布更均匀。
最终目标是评估AI能否真正进行数学思考，而非随机鹦鹉学舌。