Hasty Briefsbeta

双语

The RAG Obituary: Killed by agents, buried by context windows

8 months ago
  • #AI
  • #AgenticSearch
  • #RAG
  • 文章探讨了检索增强生成(RAG)系统因上下文窗口技术进步和基于代理的架构兴起而面临的衰落
  • RAG最初是为解决早期大语言模型(如GPT-3.5和GPT-4)的token限制而开发,用于处理超大规模知识库
  • RAG的文档分块处理存在固有缺陷:关键信息碎片化且破坏文档原始结构
  • RAG的嵌入检索流程在语义搜索方面表现欠佳,尤其面对数值数据和专业术语时更为明显
  • 混合搜索(结合语义与关键词检索)虽提升效果,却带来系统复杂性和延迟问题
  • RAG的重排序机制会引入额外成本、延迟压力与基础设施负担
  • RAG存在根本性局限:上下文割裂、语义检索失效、缺乏因果推理能力
  • 以Claude Code为代表的代理搜索新范式,通过大上下文窗口与智能导航彻底规避RAG需求
  • 代理搜索采用Grep/Glob等工具直接访问文件系统,实现实时精准且保留完整上下文的文档分析
  • AI搜索的未来在于代理系统——无需检索碎片化即可跨文档导航、推理并理解关联关系