LLM Year in Review
5 months ago
- #2025
- #AI
- #LLM
- 基于可验证奖励的强化学习(RLVR)成为大语言模型训练的重要阶段,促成了类推理策略的自然涌现。
- 2025年的大语言模型被视为'召唤幽灵'而非'进化动物',凸显其独特而参差不齐的智能特征。
- 基准测试因易受RLVR和合成数据生成影响而失去公信力,催生了'基准最大化'操作手法。
- Cursor通过上下文工程和自主性调节等功能,为大语言模型应用构建了新层级——针对垂直领域封装和编排模型调用。
- Claude Code(CC)展示了首个真正可信的大语言模型智能体,可在用户本地运行并整合私有数据与上下文。
- 氛围编程(Vibe coding)的兴起使普通人能用英语构建程序,实现编程民主化并重塑软件开发范式。
- 谷歌Gemini Nano香蕉版预示着大语言模型交互界面的未来,融合文本生成、图像生成与世界知识,实现更视觉化、空间化的交互体验。