Gemini 3性能提升但可靠性问题仍存谷歌的最新AI模型Gemini 3在多项基准测试中表现出色，暂时缓解了人们对AI

Google's Gemini 3 model keeps the AI hype train going – for now

某中心的最新Gemini 3模型继续推动AI热潮——但目前如此

据该公司称，谷歌最新的聊天机器人Gemini 3在一系列旨在衡量AI进展的基准测试中取得了显著飞跃。这些成就可能足以暂时缓解对AI泡沫破裂的恐惧，但目前尚不清楚这些分数在多大程度上能转化为真实世界的能力。

更重要的是，所有大语言模型标志性的、持续存在的事实错误和幻觉问题，并没有显示出被解决的迹象。这对于任何可靠性至关重要的应用来说都可能成为问题。