Hasty Briefsbeta

双语

RLHF Is Cr*P, It's a Paint Job on a Rusty Car: Geoffrey Hinton

a year ago

#Critique
#AI
#RLHF

AI先驱杰弗里·辛顿批评基于人类反馈的强化学习（RLHF），称其是'一堆垃圾'，并将其比作对有缺陷系统进行的表面'粉刷'。
RLHF是一种通过整合人类反馈来优化AI行为的机器学习技术，在自然语言处理等复杂任务中尤为有效。
辛顿认为RLHF只是掩盖了（如偏见、错误等）底层问题，并未解决AI设计的根本性缺陷。
辛顿的批评反映了AI界对当前技术发展路径根基不稳的普遍忧虑。
包括Meta的杨立昆等专家也质疑现有AI技术能否实现类人智能或保持持续进步。