Hasty Briefsbeta

双语

Why do LLMs have emergent properties?

a year ago

#emergence
#machine-learning
#large-language-models

当大型语言模型（LLM）的参数规模达到特定数量级时，会突然展现出新的任务处理能力，这种现象称为涌现行为
涌现现象在自然界（如相变）和机器学习中都很常见（例如参数增加时回归误差突然下降）
在算法中，当达到关键阈值（如逻辑门数量）时，功能会突然涌现，从而解锁新的能力
LLM将参数比特分配给众多任务；当某个特定任务分配到足够比特时，其能力会'突然'显现
预测LLM何时会涌现新能力极具挑战性，尤其是对创作引起共鸣的故事这类复杂且定义模糊的任务
由于高维优化和庞大的参数空间，LLM中出现涌现行为具有必然性，这使得新行为会随时间推移自然显现