Hasty Briefsbeta

双语

Google's AI Overviews spew false answers per hour, bombshell study reveals

2 days ago

#Media Impact
#AI Accuracy
#Google Search

根据创业公司Oumi的研究，谷歌的AI概览功能每小时产生数百万条不准确回答。
该分析测试了Gemini 2和Gemini 3模型的4,326个结果，发现准确率分别为85%和91%。
考虑到数十亿的搜索量，这意味着每分钟会出现数十万条错误。
错误包括基本事实性失误，例如弄错了鲍勃·马利和迪克·德拉戈相关事件的日期。
AI概览经常引用不可靠来源，如Facebook页面、博客文章和维基百科条目。
该功能容易被诱导传播虚假新闻，一个涉及捏造博客帖子的例子就证明了这一点。
模型间的引用问题恶化：'无依据'回答从Gemini 2的37%上升至Gemini 3的51%。
出版商批评谷歌未经补偿使用其内容，且缺乏事实核查监督。
谷歌质疑这项研究，指出基准测试存在缺陷，并对Oumi的方法论提出疑问。
AI概览此前曾给出过奇怪建议，如在披萨酱中添加胶水或向儿童推广烟草。