Internet Search Is Not a Naive Information Retrieval Problem
a year ago
- #LLM
- #Search Engine
- #Manipulation Resistance
- 该研究采用基于课程的渐进式策略,通过让大语言模型接触日益复杂的检索场景来增强其推理能力。
- ZEROSEARCH显著提升了大语言模型的搜索能力,其中70亿参数模型已达到真实搜索引擎水平,140亿参数模型则实现超越。
- 研究强调了大语言模型在受控条件下模拟搜索行为的能力,但对其在真实场景中抵御操纵的韧性提出质疑。
- 现实中的搜索引擎将抗操纵性置于文档相关性之上,持续面临垃圾信息、人为链接操控和不断演变的滥用策略等威胁。