AI Agents & Industry News — May 2026

2 阅读9分钟

人工智能正迅速超越传统聊天工具,逐步演变为影响金融、软件工程、网络安全、移动生态与创意产业的底层基础设施。本周的行业动态进一步表明,AI 行业竞争已不再只是模型参数和智能水平的较量,而越来越转向生态控制、工作流整合、商业化能力、自动化执行以及大规模部署能力的竞争。

AI“自信错觉”引发新的信任危机

滑铁卢大学与伦敦大学学院研究团队近日在《Communications Psychology》发表研究称,即便 AI 与人类给出完全相同的答案,人们仍普遍认为 AI 更加自信。

研究人员将这一现象称为“AI 自信错觉(AI Confidence Illusion)”。由于用户无法直接感知 AI 的不确定性,他们往往会通过回答速度、表达流畅度与决策果断程度等间接线索来判断 AI 的把握程度。再加上大众普遍默认 AI 具备高度专业能力,因此更容易高估 AI 输出内容的可靠性。

与人类交流不同,大语言模型缺乏面部表情、情绪语气与肢体语言等帮助判断真实置信度的信号。因此,即使 AI 本身并不确定甚至已经出错,用户仍可能过度信任其输出结果。

研究团队认为,未来 AI 系统需要更明确地向用户传递“置信度”信息,例如增加不确定性提示或可信度标识,以降低用户的盲目信任风险,并帮助人类做出更理性的判断。

必胜客 AI 配送系统引发超亿美元诉讼

美国快餐巨头必胜客近日因其 AI 配送管理平台 Dragontail 陷入重大法律纠纷。

一家运营约 111 家门店的大型加盟商正式起诉必胜客,称该 AI 系统导致运营效率严重下滑,并造成超过 1 亿美元的损失。在部署该平台之前,其超过 90% 的订单都能在 30 分钟内送达。然而系统上线后,外卖骑手开始利用平台机制,通过故意等待更多订单、合并配送路线等方式提高自身收益。

由于系统会实时向骑手展示后厨出餐进度,许多骑手选择等待多单凑单后再统一出发,最终导致大量订单延迟、食品变凉以及顾客满意度下降。

诉讼还指出,骑手可以提前看到订单小费金额,进而出现“挑单”现象,对低小费订单选择性拒绝。

这一案例再次说明:AI 自动化并不一定意味着效率提升。如果系统设计没有正确考虑现实中的激励机制,AI 反而可能放大运营问题并损害商业表现。

索尼澄清 Xperia AI 相机助手功能

索尼近期针对 Xperia 1 XIII 手机上的“AI Camera Assistant(AI 相机助手)”功能进行了官方说明。

索尼表示,该功能并非图像生成或后期编辑工具,而是一种基于端侧计算的实时拍摄辅助系统。系统会根据光线、景深以及拍摄主体情况,动态提供曝光、色彩与背景虚化等优化建议。

不过,索尼此前宣传中提到的“最佳拍摄角度推荐”引发了争议。许多用户发现,实际演示主要展示的是变焦建议,而非真正意义上的空间角度优化。

这一争议反映出当前智能手机行业正在面临的新挑战:如何在 AI 增强摄影与真实自然画质之间取得平衡。随着生成式 AI 与计算摄影逐渐融合,厂商不仅要提升智能化能力,也必须谨慎管理用户预期,避免算法痕迹过重影响真实视觉体验。

Linux 创始人批评 AI 垃圾漏洞报告泛滥

Linux 创始人 Linus Torvalds 近日公开批评 AI 工具在开源开发中的滥用现象。

他指出,大量开发者利用 AI 自动扫描漏洞,并重复提交已经修复的问题,导致 Linux 内核安全通道被低质量报告严重堵塞。维护者不得不反复回复“该漏洞早已修复”,大量时间被浪费在无意义的信息处理中。

Torvalds 强调,他反对的并不是 AI 本身,而是许多开发者缺乏对底层代码的真正理解,只是机械地转发 AI 扫描结果。

他呼吁贡献者提交真正有价值的修复方案和代码补丁,而不是简单“甩问题”。这一事件也折射出软件工程领域的新矛盾:AI 大幅降低了技术参与门槛,但同时也放大了低质量技术噪音。

AI 辅助安全研究突破苹果 M5 防护

安全研究公司 Calif 本周宣布,他们仅用五天时间,就成功在搭载苹果 M5 芯片的设备上完成了本地权限提升攻击。

研究团队成功绕过了苹果最新的硬件级内存安全机制 MIE(Memory Integrity Extension)。研究人员通过组合多个内核漏洞与侧信道技术,实现了无需代码注入的“纯 data-only 攻击”。

值得关注的是,Anthropic 的安全研究模型 Claude Mythos Preview 在漏洞分析过程中发挥了重要辅助作用。

这一事件说明,AI 正在同时加速网络安全领域的攻防速度。过去需要数月甚至数年的漏洞研究工作,如今可能在 AI 辅助下被压缩到数天时间。

安全研究人员警告称,未来可能进入一个“Bugmageddon”时代:攻击者与防御者都将借助 AI 快速发现、利用与修复漏洞,传统安全体系将面临巨大压力。

微软 AI CEO 预测白领工作将被自动化

微软 AI CEO Mustafa Suleyman 近日表示,未来 12 至 18 个月内,AI 将在大多数专业任务上达到人类水平。

他认为,会计、法律、营销、项目管理等大量白领工作都可能被 AI 自动化。AI 正从辅助工具逐渐转变为真正独立执行工作的“执行层”。

Suleyman 还表示,未来创建 AI 模型可能会像今天制作播客或写博客一样简单,大幅降低 AI 开发门槛。

这一观点反映出行业趋势正在发生变化:下一阶段 AI 的核心竞争点,将不再只是聊天能力,而是对专业工作流的全面替代与自动化。

arXiv 严打 AI 生成论文滥用

知名学术平台 arXiv 近日推出新规,严厉打击低质量 AI 生成论文。

平台强调,并不禁止 AI 辅助写作,但作者必须对所有内容承担完整责任。如果论文中出现 AI 幻觉内容、隐藏提示词、误导性引用或直接复制 AI 文本,作者可能面临最长一年的禁发处罚。

在处罚结束后,作者甚至可能需要先获得正式同行评审期刊接收,才能重新在 arXiv 发布论文。

这一变化显示,学术界正在从“接受 AI”逐步进入“治理 AI”阶段。未来核心问题不再是“能否使用 AI”,而是如何界定学术责任、真实性与可信度。

谷歌 Gemini Intelligence 推动系统级 AI 自动化

谷歌正式发布 Gemini Intelligence,这是面向安卓生态的新一代系统级 AI 自动化框架。

与传统聊天助手不同,Gemini Intelligence 可以跨应用完成复杂任务。例如,用户只需一句指令,系统便可自动完成打车、购物、价格比较、餐厅预订等完整流程。

不过,这一能力对硬件要求极高,包括:

  • 至少 12GB 内存
  • 旗舰级芯片
  • AI Core 系统框架
  • 安全虚拟化能力
  • 长期系统更新支持

这些要求实际上将 Gemini Intelligence 限制在高端旗舰设备上,例如三星 Galaxy Z Fold8、Galaxy S26 与 Pixel 10 系列。

这也意味着安卓生态可能进入明显的“AI 分层”时代:高端设备用户获得系统级 AI 智能体体验,而普通设备仍停留在传统交互阶段。

中国大模型调用量持续领先美国

根据 OpenRouter 最新数据,中国大模型已经连续三周在周 Token 调用量上超过美国模型。

在最新统计周期内,全球 AI 模型总调用量达到 26.9 万亿 Token。其中,中国模型贡献了 7.69 万亿,而美国模型为 4.24 万亿。

腾讯 Hy3 Preview 以 2.66 万亿 Token 成为全球调用量最高的大模型,即使其已从免费模式转为付费服务,仍保持高速增长。

这一趋势说明,中国 AI 产业不仅在模型研发层面快速扩张,也正在真实用户规模与商业落地方面建立越来越强的优势。

中国 AI 视频生成模型全球影响力快速提升

中国 AI 视频生成公司正在迅速成为全球创意 AI 领域的重要竞争者。

字节跳动与快手等企业凭借庞大的短视频数据集,训练出了高质量的视频生成模型。越来越多海外创作者认为,中国工具在提示词执行、画面稳定性以及创作自由度方面,已经优于部分西方竞争产品。

例如,字节跳动的 Seedance 2.0 在快速运动镜头、复杂机位切换以及人物面部一致性方面表现尤为突出。与此同时,快手的 Kling 平台也正在广告与电商视频领域快速扩张。

中国厂商的重要优势,在于拥有难以复制的大规模视频数据资源。同时,更低的价格与灵活的商业模式,也正在推动 AI 视频生成技术加速进入广告、娱乐与电商行业。

总结

本周 AI 行业最重要的变化,并不是某个模型参数再次刷新纪录,而是 AI 正在真正进入现实系统。

它开始影响金融决策、移动操作系统、漏洞研究、软件开发、学术出版、内容生产以及商业运营。

与此同时,一个更加关键的问题也正在浮现:

当 AI 不再只是“回答问题”,而开始真正替人执行任务、做出决策甚至影响现实世界时,人类究竟应该在多大程度上信任它?

从 AI 的“自信错觉”,到漏洞自动化、系统级智能体、AI 白领替代,再到学术治理与商业失误,行业已经逐渐意识到:未来最大的竞争,也许不仅是模型能力,而是谁能建立真正可信、稳定、可控并能够融入现实社会的 AI 系统。