Hasty Briefsbeta

双语

LLM Year in Review

5 months ago

#2025
#AI
#LLM

基于可验证奖励的强化学习（RLVR）成为大语言模型训练的重要阶段，促成了类推理策略的自然涌现。
2025年的大语言模型被视为'召唤幽灵'而非'进化动物'，凸显其独特而参差不齐的智能特征。
基准测试因易受RLVR和合成数据生成影响而失去公信力，催生了'基准最大化'操作手法。
Cursor通过上下文工程和自主性调节等功能，为大语言模型应用构建了新层级——针对垂直领域封装和编排模型调用。
Claude Code（CC）展示了首个真正可信的大语言模型智能体，可在用户本地运行并整合私有数据与上下文。
氛围编程（Vibe coding）的兴起使普通人能用英语构建程序，实现编程民主化并重塑软件开发范式。
谷歌Gemini Nano香蕉版预示着大语言模型交互界面的未来，融合文本生成、图像生成与世界知识，实现更视觉化、空间化的交互体验。