Hasty Briefsbeta

双语

The RAG Obituary: Killed by agents, buried by context windows

8 months ago

#AI
#AgenticSearch
#RAG

文章探讨了检索增强生成（RAG）系统因上下文窗口技术进步和基于代理的架构兴起而面临的衰落
RAG最初是为解决早期大语言模型（如GPT-3.5和GPT-4）的token限制而开发，用于处理超大规模知识库
RAG的文档分块处理存在固有缺陷：关键信息碎片化且破坏文档原始结构
RAG的嵌入检索流程在语义搜索方面表现欠佳，尤其面对数值数据和专业术语时更为明显
混合搜索（结合语义与关键词检索）虽提升效果，却带来系统复杂性和延迟问题
RAG的重排序机制会引入额外成本、延迟压力与基础设施负担
RAG存在根本性局限：上下文割裂、语义检索失效、缺乏因果推理能力
以Claude Code为代表的代理搜索新范式，通过大上下文窗口与智能导航彻底规避RAG需求
代理搜索采用Grep/Glob等工具直接访问文件系统，实现实时精准且保留完整上下文的文档分析
AI搜索的未来在于代理系统——无需检索碎片化即可跨文档导航、推理并理解关联关系