AI搜索工具常提供缺乏依据的回答，可信度堪忧一项研究分析了包括某中心的GPT系列、某机构的Bing Chat在内的多种生

生成式人工智能工具，以及由其驱动的深度研究代理和搜索引擎，经常做出其引用的来源并未支持的、无依据且带有偏向性的声称。一项分析发现，由AI工具提供的答案中，约有三分之一没有得到可靠来源的证实。对于某机构的GPT 4.5，这一比例甚至更高，达到了47%。

某机构AI研究院的研究人员及其同事测试了包括某机构的GPT-4.5和5、You.com、Perplexity和某机构的Bing Chat在内的生成式AI搜索引擎。与此同时，他们测试了五种深度研究代理：GPT-5的“深度研究”功能、Bing Chat的“深入思考”选项，以及由You.com、某机构Gemini和Perplexity提供的深度研究工具。