Gemini 3性能提升但可靠性问题仍存

1 阅读1分钟

Google's Gemini 3 model keeps the AI hype train going – for now

某中心的最新Gemini 3模型继续推动AI热潮——但目前如此

据该公司称,谷歌最新的聊天机器人Gemini 3在一系列旨在衡量AI进展的基准测试中取得了显著飞跃。这些成就可能足以暂时缓解对AI泡沫破裂的恐惧,但目前尚不清楚这些分数在多大程度上能转化为真实世界的能力。

更重要的是,所有大语言模型标志性的、持续存在的事实错误和幻觉问题,并没有显示出被解决的迹象。这对于任何可靠性至关重要的应用来说都可能成为问题。