GMI Cloud@AI 周报 | Gemini3 Flash发布；阿里发布Wan2.6；小米开源MiMo-V2-Flash

关键词：Gemini 3 Flash; Wan2.6；

Giants

腾讯 AI 组织架构全面升级；MiniMax 和智谱 AI 通过港交所聆讯；布林坦承谷歌 AI 战略失误

布林坦承谷歌低估 Transformer，还被 OpenAI 挖走 Ilya

谷歌联合创始人谢尔盖·布林在最新访谈中罕见承认，谷歌在 AI 发展初期严重低估了 Transformer 架构的革命性意义。布林坦承，谷歌在 2017 年发布 Transformer 论文后，未能充分认识到其巨大潜力，导致在后续的 AI 竞争中处于被动地位。更令人意外的是，谷歌不仅错过了技术先机，连关键人才也流失严重——OpenAI 联合创始人 Ilya Sutskever 就曾短暂就职于谷歌，最终选择离开并成为 OpenAI 的核心人物。这一表态反映了谷歌在 AI 战略执行上的重大失误，也为业界提供了宝贵的反思素材。

百度拿下 1.69 亿 AI 大单

百度成功签署价值 1.69 亿元人民币的 AI 大单，标志着其在企业级 AI 应用市场取得重大突破。该订单涵盖智能客服、语音识别、自然语言处理等多个 AI 技术领域，体现了百度在 AI 技术商业化方面的综合实力。此次大单的获得不仅为百度带来了可观的收入，更重要的是验证了其 AI 技术在实际业务场景中的价值。随着 AI 技术的不断成熟，企业级市场需求旺盛，百度有望在激烈的市场竞争中占据更有利地位。

腾讯 AI 组织架构全面升级，98 年清华姚班姚顺雨出任首席 AI 科学家

腾讯宣布全面升级 AI 组织架构，98 年清华姚班毕业的姚顺雨出任腾讯首席 AI 科学家。姚顺雨在 AI 领域有着深厚的学术背景和丰富的实践经验，此次任命标志着腾讯在 AI 战略上的重大调整。腾讯此次组织架构升级旨在加强 AI 研发能力，推动公司在人工智能领域的技术创新和商业应用。新架构将更加注重 AI 技术与各业务线的深度融合，提升腾讯在 AI 时代的核心竞争力。

MiniMax 和智谱 AI 通过港交所聆讯，AI 六小龙抢跑 IPO

"AI 六小龙"中的 MiniMax 和智谱 AI 均于本周初获得了中国证监会备案，并参与了港交所的上市聆讯。这两家公司在 AI 大模型领域都有着重要布局，MiniMax 专注于多模态 AI 技术，智谱 AI 则在通用大模型方面表现突出。此次通过港交所聆讯标志着中国 AI 独角兽企业正式进入资本市场，也为 AI 行业的商业化发展提供了新的路径。随着 AI 技术的不断成熟和市场需求的增长，更多 AI 企业有望通过 IPO 获得发展资金，推动行业整体进步。

Models & Applications

谷歌发布 Gemini 3 Flash 模型；GPT-5.2 降智遭全网差评；阿里发布 Wan2.6

GPT-5.2 降智遭全网差评，奥特曼紧急应对

OpenAI 最新发布的 GPT-5.2 版本遭遇用户大规模差评，主要问题集中在模型"降智"现象明显。用户在测试中发现，新版本在逻辑推理、创意写作等核心能力上反而不如前代版本，引发广泛不满。CEO 奥特曼紧急回应称这是训练过程中的技术问题，承诺将尽快修复。此次事件暴露了 AI 模型迭代中的技术挑战，也提醒业界在追求规模扩张的同时不能忽视基础能力的稳定性。

谷歌发布 Gemini 3 Flash 模型，编程能力反超 Gemini 3 Pro

谷歌发布最新模型 Gemini 3 Flash ，拥有前沿智能，专为速度而生。Gemini 3 Flash 在博士级别的推理和知识基准测试中展现出前沿性能，足以媲美规模更大的前沿模型，并且在多项基准测试中显著超越了 Gemini 2.5 Pro。在编程性能上，Gemini 3 Flash 在 SWE-bench Verified 基准测试中得分高达 78%，不仅超越了 2.5 系列，甚至超越了 Gemini 3 Pro。该模型速度提升 3 倍，价格更低，定价为每百万个输入 token 0.50 美元，每百万个输出 token 3 美元。Gemini 3 Flash 现已面向全球数百万用户推出，适用于 Google AI Studio、Gemini CLI 和 Google Antigravity 平台，并作为搜索中 AI 模式的默认模型。

谷歌发布实时 AI 同传功能及新一代 AI 浏览器

谷歌重磅推出 AI 同传功能，现已集成到所有耳机产品中，实现实时多语言翻译。同时，谷歌还发布了一款颠覆性的 AI 浏览器，集成了先进的 AI 助手功能，能够智能理解网页内容并提供个性化服务。这两项产品的发布标志着谷歌在 AI 应用场景化方面取得重要进展，特别是在消费级产品中的 AI 技术落地。AI 同传的推出有望彻底改变跨语言交流方式，而 AI 浏览器则重新定义了用户的上网体验。

Thinking Machines 更新 K2 Thinking 和 Qwen3-VL 支持微调

Thinking Machines 公司发布首款产品的重大更新，K2 Thinking 和 Qwen3-VL 模型现已支持微调功能。这一更新为开发者提供了更大的灵活性，能够根据特定需求对模型进行定制化训练。K2 Thinking 在推理能力方面表现突出，而 Qwen3-VL 则在多模态理解任务中展现强大能力。两款模型的开源微调支持将大大降低 AI 应用开发门槛，推动 AI 技术在更多垂直领域的应用落地。

英伟达宣布开源 Nemotron 3 家族大模型，黄仁勋不想只「卖铲子」

英伟达对外宣布开源 Nemotron 3 家族大模型，包括 Nano、Super、Ultra 三个版本，标志着公司从单纯的硬件提供商向软件生态建设者转型。CEO 黄仁勋表示，英伟达不想只"卖铲子"，而是要构建完整的 AI 生态系统。Nemotron 3 Nano 版本已率先发布，Super 和 Ultra 版本规划在 2026 年上半年发布。该开源大模型基于英伟达最新的 GPU 架构优化，在训练效率和推理性能方面都有显著提升。此举不仅为开发者社区提供了强大的工具，也展示了英伟达在 AI 软件领域的雄心，有助于公司在 AI 价值链中占据更重要的位置。

OpenAI发布 GPT-Image-1.5 图像生成模型

OpenAI 发布 GPT-Image-1.5 旗舰图像生成模型，在图像质量和生成速度方面全面超越现有的 Nano Banana 模型。GPT-Image-1.5 采用了最新的扩散技术和优化算法，能够生成高分辨率、细节丰富的图像内容。OpenAI 此次发布进一步巩固了其在图像生成领域的领导地位，也为用户提供了更多样化的创作工具。GPT-Image-1.5 将集成到 ChatGPT 中，为用户提供一体化的文本和图像生成体验。

阿里发布 Wan2.6 视频生成模型，支持多种视频风格生成

阿里发布全新的 Wan2.6 视频生成模型，声称具备全球最全面的视频生成功能。该模型支持多种视频风格和场景生成，能够根据文本描述生成高质量的视频内容。 Wan2.6 在技术指标上达到了行业领先水平，特别是在视频长度、分辨率和生成速度方面表现突出。该模型的发布标志着阿里在多模态 AI 技术方面的重大突破，也为内容创作行业带来了新的可能性。

小米开源代码模型 MiMo-V2-Flash，总体媲美 DeepSeek-V3.2

小米在罗福莉首秀前突然发布并开源代码生成模型MiMo-V2-Flash ，该模型在代码生成能力上总体媲美 DeepSeek-V3.2。MiMo-V2-Flash 支持多种编程语言，能够生成高质量的代码片段并提供智能调试建议。该模型的发布展示了小米在 AI 技术研发方面的实力，也为开发者提供了新的编程辅助工具。小米表示，该模型将集成到其生态系统中，为用户提供更智能的开发体验。

蚂蚁数科开源 Agentar-SQL 系列模型，霸榜全球最难SQL榜单超两月

蚂蚁数科在第二届 CCF 中国数据大会上正式宣布开源旗下数据智能体关键技术——Agentar-SQL 系列。该系列模型在低调霸榜全球最难的 SQL 数据库查询榜单超过两个月，在复杂的数据库查询任务中表现卓越，超越了包括 GPT 系列在内的多个国际知名模型。Agentar-SQL 系列的开源决定体现了中国 AI 技术自信，也为全球开发者社区贡献了重要资源。这一事件标志着国产 AI 技术在国际舞台上取得了重要突破，展现了中国在特定 AI 应用领域的领先实力。

Runway 公司发布 GWM-1 世界模型，进军通用 AI 领域

美国知名视频生成公司 Runway 正式宣布进军世界模型领域，发布了基于 Gen-4.5 架构的 GWM-1 通用世界模型。该模型支持实时交互控制，能够模拟真实环境、人物对话和机器人操作等多种场景。Runway 此次入局世界模型领域标志着视频生成技术向更通用 AI 应用的拓展，也为游戏、影视、机器人等行业带来了新的技术可能性。世界模型的发展将直接影响自动驾驶、虚拟现实等关键应用的技术进步。

全球AI政策与市场简讯

小米语音首席科学家：AI 发展本质如生物进化，不开源要慢 1000 倍

小米语音首席科学家在 MEET2026 大会上发表演讲，提出 AI 发展的本质如同生物进化，需要通过开源协作实现快速迭代。他指出，如果 AI 技术不采用开源模式，其发展速度将比现在慢 1000 倍。这一观点强调了开源生态对 AI 技术进步的重要性，也反映了小米在 AI 发展策略上的思考。该演讲为 AI 行业的开源发展提供了重要理论支撑，有助于推动更多企业参与到 AI 技术的开放协作中来。

蚂蚁阿福冲上苹果应用榜第三，有望成为国民级 AI App

蚂蚁集团推出的 AI 助手"阿福"冲上苹果应用商店排行榜第三位，展现出成为国民级 AI 应用的潜力。阿福集成了多种 AI 功能，包括智能对话、文档处理、图像识别等，为用户提供全方位的 AI 辅助服务。该应用的成功反映了用户对 AI 助手的强烈需求，也展示了蚂蚁集团在 AI 产品化方面的实力。阿福的快速崛起为 AI 应用的商业化探索提供了重要参考。

以上所有信息源自网络

THE END

关于 GMI Cloud

由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商，是全球七大 Reference Platform NVIDIA Cloud Partner 之一，拥有遍布全球的数据中心，为企业 AI 应用提供最新、最优的 GPU 云服务，为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。

GMI Cloud 凭借高稳定性的技术架构、强大的GPU供应链以及令人瞩目的 GPU 产品阵容（如能够精准平衡 AI 成本与效率的 H200、具有卓越性能的 GB200、GB300 以及未来所有全新上线的高性能芯片），确保企业客户在高度数据安全与计算效能的基础上，高效低本地完成 AI 落地。此外，通过自研“Cluster Engine”、“Inference Engine”两大平台，完成从算力原子化供给到业务级智算服务的全栈跃迁，全力构建下一代智能算力基座。

作为推动通用人工智能（AGI）未来发展的重要力量，GMI Cloud 持续在 AI 基础设施领域引领创新。选择 GMI Cloud，您不仅是选择了先进的 GPU 云服务，更是选择了一个全方位的 AI 基础设施合作伙伴。

如果您想要了解有关 GMI Cloud 的信息

请关注我们并建立联系