4月7日,有测试显示谷歌AI概览(AI Overviews)整体准确率约为90%。按其年搜索量超5万亿次估算,该功能每小时可能生成超过5700万条错误答案,相当于每分钟近100万条。另一项测试发现,Gemini 3模型今年2月的准确率为91%,但其回答与所引用来源不一致的比例升至56%。此外,该模型容易被虚假信息误导,还出现过AI给出的答案与页面下方提供的链接内容互相矛盾的情况。谷歌方面回应称,相关测试方式未能真实反映普通用户的使用场景。