The RAG Obituary: Killed by agents, buried by context windows
8 months ago
- #AI
- #AgenticSearch
- #RAG
- 文章探讨了检索增强生成(RAG)系统因上下文窗口技术进步和基于代理的架构兴起而面临的衰落
- RAG最初是为解决早期大语言模型(如GPT-3.5和GPT-4)的token限制而开发,用于处理超大规模知识库
- RAG的文档分块处理存在固有缺陷:关键信息碎片化且破坏文档原始结构
- RAG的嵌入检索流程在语义搜索方面表现欠佳,尤其面对数值数据和专业术语时更为明显
- 混合搜索(结合语义与关键词检索)虽提升效果,却带来系统复杂性和延迟问题
- RAG的重排序机制会引入额外成本、延迟压力与基础设施负担
- RAG存在根本性局限:上下文割裂、语义检索失效、缺乏因果推理能力
- 以Claude Code为代表的代理搜索新范式,通过大上下文窗口与智能导航彻底规避RAG需求
- 代理搜索采用Grep/Glob等工具直接访问文件系统,实现实时精准且保留完整上下文的文档分析
- AI搜索的未来在于代理系统——无需检索碎片化即可跨文档导航、推理并理解关联关系