Hasty Briefsbeta

双语

Context Engineering for Agents

a year ago

#LLM
#Agents
#Context-Engineering

智能体执行任务需要上下文环境，而上下文工程就是优化大语言模型上下文窗口内信息的过程。
大语言模型被类比为操作系统，其上下文窗口如同内存条（RAM），容量有限需要精心管理。
上下文类型包括：指令（提示词、工具描述）、知识（事实、记忆）和工具（来自工具调用的反馈）。
长时间运行的智能体任务可能导致上下文污染、注意力分散、逻辑混乱和指令冲突等因token过量产生的问题。
上下文工程的四大核心策略是：写入、筛选、压缩和隔离。
写入上下文指将信息保存在上下文窗口之外，例如使用草稿板或长期记忆存储。
筛选上下文意味着在需要时检索相关信息（如记忆、工具），通常借助嵌入向量或知识图谱实现。
压缩上下文通过摘要提炼或修剪技术来减少token消耗。
隔离上下文通过子智能体或沙箱环境分割任务，以管理高token消耗的操作。
多智能体系统和状态对象能有效实现上下文的隔离与管理。