Hasty Briefsbeta

双语

Google's AI Overviews spew false answers per hour, bombshell study reveals

2 days ago
  • #Media Impact
  • #AI Accuracy
  • #Google Search
  • 根据创业公司Oumi的研究,谷歌的AI概览功能每小时产生数百万条不准确回答。
  • 该分析测试了Gemini 2和Gemini 3模型的4,326个结果,发现准确率分别为85%和91%。
  • 考虑到数十亿的搜索量,这意味着每分钟会出现数十万条错误。
  • 错误包括基本事实性失误,例如弄错了鲍勃·马利和迪克·德拉戈相关事件的日期。
  • AI概览经常引用不可靠来源,如Facebook页面、博客文章和维基百科条目。
  • 该功能容易被诱导传播虚假新闻,一个涉及捏造博客帖子的例子就证明了这一点。
  • 模型间的引用问题恶化:'无依据'回答从Gemini 2的37%上升至Gemini 3的51%。
  • 出版商批评谷歌未经补偿使用其内容,且缺乏事实核查监督。
  • 谷歌质疑这项研究,指出基准测试存在缺陷,并对Oumi的方法论提出疑问。
  • AI概览此前曾给出过奇怪建议,如在披萨酱中添加胶水或向儿童推广烟草。