Gemini 3震撼发布:史上最强AI模型登场

0 阅读4分钟

Google发布Gemini 3系列模型,号称最智能、事实最准确。新模型Gemini 3 Pro原生多模态,能处理文本、图像和音频,提升Google产品体验,并直接挑战OpenAI。

译自:Google is launching Gemini 3, its ‘most intelligent’ AI model yet

作者:Emma Roth

Google 昨天推出了 Gemini 3 系列模型,该公司表示这是其“最智能”且“事实最准确”的人工智能系统。这也有望让 Google 在 OpenAI 经历 GPT-5 推出失误后,一举超越对手,可能将该公司置于面向消费者的 AI 模型的最前沿。

Google 首次在 Gemini 应用中向所有人开放其新的旗舰 AI 模型——Gemini 3 Pro。它还将 Gemini 3 Pro 推送给搜索中的订阅用户。Google DeepMind 产品总监兼产品负责人 Tulsee Doshi 表示,新模型将使公司更接近于实现信息的“普遍可访问和有用”,同时其搜索引擎将继续不断发展。

“我认为朝着这个方向迈出的一个非常大的进步是,摆脱了仅仅是文本回复的模式,为你提供更丰富、更完整的你实际能看到的内容。”

Gemini 3 Pro 增强的编码功能使其能够生成更好的视觉效果。

Gemini 3 Pro 增强的编码功能使其能够生成更好的视觉效果。

Gemini 3 Pro 是“原生多模态”的,意味着它可以同时处理文本、图像和音频,而不是单独处理。例如,Google 表示 Gemini 3 Pro 可用于翻译食谱照片,然后将它们转换成食谱书,或者根据一系列视频讲座创建交互式抽认卡。

你会在 Google 的产品套件中看到其中一些改进,包括 Gemini 应用,你可以在内置工作区 Canvas 中构建更“功能齐全”的程序。升级后的 AI 模型还将支持“生成式界面”,这是 Google 在 Gemini Labs 中测试的一项工具,允许 Gemini 3 Pro 创建视觉的、杂志风格的格式,其中包含你可以浏览的图片,或者一个根据你的提示量身定制的自定义用户界面的动态布局。

Gemini 应用中的实验性“动态视图”为某些查询创建了类似网页的体验。

Gemini 应用中的实验性“动态视图”为某些查询创建了类似网页的体验。

AI 模式下的 Gemini 3 Pro——由 AI 驱动的 Google 搜索功能——将同样根据你的查询为你呈现视觉元素,如图像、表格、网格和模拟。它还可以使用升级版的 Google“查询扇出技术”执行更多搜索,该技术现在不仅可以将问题分解成它可以代表你搜索的片段,而且根据 Google 的公告,它能更好地理解意图,以“找到它以前可能错过的新内容”。

Google 还在毫不掩饰地抨击 OpenAI,称 Gemini 3 Pro 不太容易出现 ChatGPT 所宣扬的那种空洞奉承。Doshi 表示,你将看到 Gemini 3 Pro 的响应发生“显著”变化,Google 将其描述为提供“智能、简洁和直接,用真诚的见解取代陈词滥调和奉承——告诉你你需要听到的,而不仅仅是你想要听到的。”该公司表示,它还表现出“减少了谄媚”,这是 OpenAI 今年早些时候不得不解决的 ChatGPT 问题

除了这些改进之外,Gemini 3 Pro 还具备了更强的推理和代理能力,使其能够完成更复杂的任务,并“可靠地在更长的时间范围内进行规划”,Google 表示。该 AI 模型正在为一项实验性的 Gemini Agent 功能提供支持,该功能可以代表你在 Gemini 应用内执行任务,例如审查和组织电子邮件,或研究和预订旅行。

AI 模式下的 Gemini 3 Pro 可以在其响应中嵌入交互式模拟。

AI 模式下的 Gemini 3 Pro 可以在其响应中嵌入交互式模拟。

Gemini 3 Pro 现在位居 LMArena 排行榜的榜首,这是一个用于基准测试 AI 模型的流行平台。深度思考模式进一步增强了模型的推理能力,尽管目前仅供安全测试人员使用。

Gemini 3 Pro 今日起在 Gemini 应用中对所有人开放,而美国地区的 Google AI Pro 和 Ultra 订阅用户可以在 AI 模式下通过从模型下拉菜单中选择“思考”来试用 Gemini 3 Pro。Gemini Agent 将首先向 AI Ultra 订阅用户推出。