AI搜索工具常提供缺乏依据的回答,可信度堪忧

20 阅读1分钟

生成式人工智能工具,以及由其驱动的深度研究代理和搜索引擎,经常做出其引用的来源并未支持的、无依据且带有偏向性的声称。一项分析发现,由AI工具提供的答案中,约有三分之一没有得到可靠来源的证实。对于某机构的GPT 4.5,这一比例甚至更高,达到了47%。

某机构AI研究院的研究人员及其同事测试了包括某机构的GPT-4.5和5、You.com、Perplexity和某机构的Bing Chat在内的生成式AI搜索引擎。与此同时,他们测试了五种深度研究代理:GPT-5的“深度研究”功能、Bing Chat的“深入思考”选项,以及由You.com、某机构Gemini和Perplexity提供的深度研究工具。