每日AI资讯05-21

245 阅读2分钟

每日AI资讯05-21

新闻摘要

1.Android上的免登录版ChatGPT已进入测试阶段

2.Gemini 1.5 Pro:谷歌数学版突破性进展

3.百度Apollo在武汉发布支持L4级自动驾驶大模型

4.三星电子争取赢得英伟达3纳米订单

5.英伟达即将公布财报,市场预期乐观

6.腾讯大模型推出腾讯元宝、腾讯元器

7.国产大模型的价格战开始

8.小鹏汽车宣布自动驾驶大模型量产上车,全球测试正在进行

9.周鸿祎与母校郑州九中联合打造“360全国首家AI实验校”

10.开放云睿大模型助力建设时空智能城市

11.大模型独角兽月之暗面辟谣收费 称“小范围测试Kimi打赏功能”

12.AI应用加速落地:算力及终端打开增量空间

13.特斯拉FSD V12:智能驾驶技术的新里程碑

14.微软推出Copilot+ PCs,力邀Adobe带来「全家桶」原生支持

15.英伟达“携手”戴尔AI电脑:这是推动进一步扩张的关键

16.斯嘉丽·约翰逊反对OpenAI,导致ChatGPT暂停类似她声音的选项

17.智源评测体系发布,百余大模型评估结果出炉

18.AI在心智理论测试中表现超越人类

扫码加入交流群

获得更多技术支持和交流

(请注明自己的职业)

123

1.Android上的免登录版ChatGPT已进入测试阶段

OpenAI的ChatGPT免登录版现已在Android上进行测试。用户无需创建账户即可使用ChatGPT与人工智能聊天机器人对话。尽管免登录版本提供了基本的聊天功能,但拥有账户的用户可以享受保存聊天记录、分享内容、解锁语音对话和自定义指令等附加功能。 OpenAI强调,免登录版本让用户更加方便快捷地使用ChatGPT,尤其适用于那些期待OpenAI推出类似Google专用搜索引擎功能的用户。目前,该功能预计将在不久的将来同时适用于Android和iOS设备。 值得注意的是,免登录版本不支持用户上传图片,这一功能需要使用GPT-4o模型并通过免费或高级账户登录才能使用。OpenAI还在春季更新活动中展示了新的MacOS ChatGPT应用程序和人工智能语音支持,但暂时停止了一个听起来很像斯嘉丽·约翰逊的AI语音。 此外,ChatGPT现在支持Google Drive和OneDrive等云存储服务,并提供数据分析的互动工具,能够从Reddit帖子中提取内容,这是OpenAI与Reddit合作的一部分。

2.Gemini 1.5 Pro:谷歌数学版突破性进展

在谷歌I/O大会上,Gemini 1.5 Pro的发布引起了广泛关注。最新技术报告显示,Gemini 1.5 Pro在数学领域的表现超越了GPT-4 Turbo和Claude 3 Opus,成为全球最强的数学模型之一。 Gemini 1.5 Pro在数学评测中取得了突破性成绩,包括MATH测试中达到了91.1%的准确率,与人类专家水平相当。除了数学领域,在推理、编码、多模态多项基准测试中也表现出色。 Gemini 1.5 Pro的发布标志着数学模型领域的重大突破,为解决复杂数学难题提供了强大的工具。

3.百度Apollo在武汉发布支持L4级自动驾驶大模型

百度Apollo于5月15日在湖北武汉发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM,并同步上新搭载了百度第六代智能化系统解决方案的萝卜快跑无人车。该大模型基于大模型技术重构自动驾驶,能够兼顾技术安全性和泛化性,实现城市级全域复杂场景覆盖。在武汉,百度萝卜快跑已成功攻克复杂道路场景,为近半数的武汉市民提供便捷的无人化出行服务。目前,萝卜快跑已在武汉服务面积超过3000平方公里,覆盖770万人口,并计划在今年内在武汉市场投放千台无人车。

4.三星电子争取赢得英伟达3纳米订单

据报道,三星电子正计划抢占全球主要半导体设计专家NVIDIA的3纳米订单。这一举措旨在缓解台积电面临的风险并弥补与NVIDIA的差距。该公司将重点放在量产3纳米第二代环栅(GAA)工艺,以赢得NVIDIA订单。三星电子正在寻求机会在人工智能市场上脱颖而出,成为存储器和代工供应链的重要合作伙伴。与此同时,三星电子的内存业务部门正在与NVIDIA就HBM3E的供货事宜进行洽谈。

5.英伟达即将公布财报,市场预期乐观

英伟达将于周三公布最新财报,市场预期乐观。过去五个季度,英伟达每股收益(EPS)连续超预期,特别是AI芯片需求的爆发推动其季度营收从20亿美元飙升至200亿美元。微软、谷歌、亚马逊AWS和META等科技巨头的云计算投资将继续推动英伟达的数据中心收入增长。多家机构上调了目标价,预期英伟达营收在235亿至245亿美元之间,同比增长234%。尽管估值较高,英伟达在AI领域的领导地位和技术创新确保其未来增长潜力巨大。

6.腾讯大模型推出腾讯元宝、腾讯元器

在“腾讯云生成式AI产业应用峰会”上,腾讯展示了其大模型和产品,包括即将发布的C端助手App——腾讯元宝。腾讯混元大模型已拓展至万亿规模,并采用混合专家模型结构,性能显著提升,部分中文能力已追平GPT-4。 腾讯云副总裁吴运声表示,腾讯注重底层能力和工具链的构建,强调“产业实用”为核心战略,推出了大模型知识引擎、图像创作引擎、视频创作引擎三大工具。混元大模型已在600多个腾讯内部业务中落地,并将通过腾讯云API开放模型能力,满足企业需求。 此外,腾讯还推出智能体创作与分发平台“腾讯元器”,用户可以创建并分发专属AI智能体,进一步推动产业应用。腾讯在全球竞争激烈的AI大模型赛道上,致力于抓住每一个重塑自我的机会。

7.国产大模型的价格战开始

大模型领域的价格战已经开始,DeepSeek率先点燃了价格战的引线,将旗下的大模型DeepSeek-V2的价格降到每百万tokens仅需3元,显著低于GPT-4的价格。随后,智谱AI和火山引擎纷纷跟进,智谱AI的GLM-3-Turbo价格降至每千tokens 0.001元,火山引擎则将豆包主力模型的定价降低到每千tokens 0.0008元。百度和阿里的大模型成为比价的参照物,虽然价格战看似混乱,但价格敏感的客户仍然是主要目标。各大厂商通过降价吸引用户,并通过赠送大量tokens来进一步吸引开发者。 腾讯云副总裁吴运声强调,腾讯在大模型领域的核心战略是“产业实用”,即通过高性能的模型、高效率的工具平台和强安全的模型环境,推动大模型在产业中的应用。混元大模型已在600多个腾讯内部业务中落地,并计划通过腾讯云API开放模型能力,以满足企业客户的需求。 DeepSeek等公司通过技术创新和优化降低大模型的推理成本,例如通过优化架构和算法,以及利用强大的硬件资源。尽管价格战可能带来更广泛的AI应用普及,但长期的竞争仍需要依赖技术能力和创新。 总体来看,价格战虽然能短期内吸引更多用户,但长期而言,技术和创新才是确保大模型普及和持续发展的关键。价格战最终可能让少数头部企业受益,但对整个行业来说,更重要的是在价格、技术和产品上全面竞争,以实现更广泛的应用和发展。

8.小鹏汽车宣布自动驾驶大模型量产上车,全球测试正在进行

小鹏汽车宣布推送AI天玑系统至所有在售车型,覆盖全球,同时预告MONA系列首款车型将于今年6月亮相。该公司的AI智驾汽车具备主动学习、快速成长和千人千面等核心特征。其最新推出的端到端大模型包括神经网络XNet、规控大模型XPlanner和大语言模型XBrain,将提升自动驾驶系统的感知、规划和决策能力。小鹏汽车计划在2025年在中国实现类L4级智驾体验,并正在全球范围进行测试。公司还将投入35亿元用于智能研发,并新招募4000名专业人才。在AI天玑系统全面接入大模型后,用户将获得更智能的专属车载AI助理服务,提供更安全、更舒心的驾乘体验。

9.周鸿祎与母校郑州九中联合打造“360全国首家AI实验校”

360集团创始人周鸿祎与母校郑州九中合作,共同打造“360全国首家AI实验校”,通过引入创新AI工具、AI数字人进课堂及校园系统的AI升级,推进AI技术在教学中的应用,提升教育质量。 周鸿祎作为郑州九中的校友,早在2018年便与母校合作创办了以“新工科”为方向的“360创新实验班”,培养AI、智能制造等领域的人才。本次合作将进一步升级,重点在基础教育模块中运用AI技术,进行研究合作与课程开发。 360AI工具将提高教学和学习效率,包括智能总结内容、生成思维导图和中英文翻译等功能。360还将引入AI数字人技术,让学生与虚拟历史人物互动,增强课堂互动性和生动性。同时,360将为郑州九中定制校园智脑系统,优化教学与学习场景。 此前,360已与北京市第八十中学共建人工智能教育基地,通过前沿AI技术和工具赋能教学实践,提升学生的AI应用能力。

10.开放云睿大模型助力建设时空智能城市

高德地图旗下高德云图在AI Day技术开放日上宣布,将逐步开放云睿时空融合大模型和云境AI三维重建平台,以构建时空智能体应用生态,助力智慧城市向时空智能城市转型。高德地图董事长刘振飞表示,技术和开放是高德迎接AI时代的选择,已与浙江省衢州市达成合作意向,将共同打造首个时空智能城市。高德云图副总裁、总经理董振宁表示,通过三大升级,即感知层、推理层和决策层的推动,助力智慧城市向时空智能城市发展。高德云图将开放云睿大模型和云境平台,与各行各业合作,共建时空智能体应用生态,构筑更具前瞻性、立体、精准和高效的时空智能城市。

11.大模型独角兽月之暗面辟谣收费 称“小范围测试Kimi打赏功能”

据报道,大模型创业企业月之暗面旗下的智能助手Kimi近日被传开始收费。然而,实际上,记者未在Kimi网页端找到付费入口,也未见到付费链接。相反,Kimi在询问如何打赏时却弹出了打赏入口,提供了6种不同价格的打赏方案。月之暗面相关负责人回应称,Kimi仍然是免费的,而所谓的打赏功能只是进行小范围测试,并表示用户在高峰期算力不足时稍等即可继续使用Kimi。

12.AI应用加速落地:算力及终端打开增量空间

近期,AI技术的发展已经从技术突破进入到落地应用的新阶段。针对此趋势,投资者应重新审视和调整投资策略。AI应用商业化加速,海内外大模型的发布催生了新一轮AI应用的讨论,重点在于提高多模态能力、Agent能力和降低API调用成本等方面。同时,算力需求的增加持续验证了算力的基石地位,各类涉及算力领域的投资机会备受关注。此外,新一轮终端升级有望开启,AI技术的应用使得各类终端产品具备更强的智能化能力,预计将带来销量和盈利能力的双重提升。

13.特斯拉FSD V12:智能驾驶技术的新里程碑

特斯拉的FSD V12版本在智能驾驶领域引起了广泛关注。这一版本的主要改进体现在驾驶体验的人性化上,尤其是在速度和转向控制的顺畅度方面。相较于之前版本,特斯拉FSD V12在处理非结构化场景和特殊情况时表现更加出色,减少了驾驶员的干预次数。此外,V12版本在处理一些复杂情境时展现出了更智能的能力,甚至在面临难题时能够做出自主的决策。特斯拉的FSD V12使用了端到端神经网络技术,使系统能够更好地理解周围环境,减少了驾驶员的干预,提高了自动驾驶的精准度和自动化程度。 特斯拉对智能驾驶技术的持续投入以及FSD V12的引入,为智能驾驶领域带来了新的突破和机遇。尽管存在一些不足之处,如对特殊路标或车道的识别可能出现错误等,但特斯拉的技术更新和投入表明了其对智能驾驶技术的决心和信心。随着特斯拉FSD在技术上的不断进步和在市场上的不断普及,智能驾驶领域的格局可能会发生进一步变化,尤其是在中国市场的落地和发展方面,也将带来更多的关注和期待。

14.微软推出Copilot+ PCs,力邀Adobe带来「全家桶」原生支持

微软在北京时间5月21日凌晨1点举办的Build开发者前瞻大会上,微软首席执行官萨蒂亚・纳德拉提出了名为「Copilot+ PCs」的新一类Windows PC,并描述其为「新一类Windows PC」。 「Copilot+ PCs」的硬件要求包括不依赖云的本地处理生成式AI Copilot进程,并配备神经处理单元(NPU)的芯片组。微软正在采取合作伙伴优先的方式制造Copilot+ PC,与AMD、英特尔、高通等芯片制造商以及宏碁、华硕、戴尔、惠普和联想等主要原始设备制造商展开合作。 微软表示,已经重构了Windows 11系统,使Copilot+ PC的性能超过配备M3处理器的最先进MacBook Air,并具有超过一天的续航时间。此外,微软还透露,它的Copilot+个人电脑将在OpenAI的gpt-40模型上运行,允许用户通过文本、视频和语音与电脑互动,并与Copilot进行自然对话。 除了扩充硬件产品外,微软还与Adobe公司合作,在Windows on ARM平台上提供全套Adobe应用程序,包括Photoshop、Lightroom、Firefly和Express,预计6月还将推出Illustrator和Premiere Pro。

15.英伟达“携手”戴尔AI电脑:这是推动进一步扩张的关键

近日,戴尔推出了新款AI电脑,并与英伟达达成合作。英伟达首席执行官黄仁勋表示,此次合作将把人工智能传播给更广泛的客户,帮助企业和组织创建“人工智能工厂”,不仅仅是提供硬件,而是提供整个基础设施。 戴尔发布了五款全新的增强型AI电脑,搭载高通Snapdragon X系列芯片和内置的神经处理单元(NPU),可以加速AI任务,如运行聊天机器人。这些新电脑还配有专用按键,一键启动微软的AI Copilot服务,自动完成文档总结和撰写备忘录等任务。戴尔希望这些AI电脑能够帮助其重振业务。 戴尔是向政府机构和企业提供计算基础设施的最大供应商之一,而英伟达的客户主要是超大规模的数据中心运营商,如微软、Meta、亚马逊和谷歌母公司Alphabet。此次合作将帮助英伟达更深入地进入企业市场,推动机构和企业开发自己的人工智能能力,从而刺激对英伟达产品的需求。 英伟达的成功在于其为向人工智能的转变做好了准备,并在创新方面领先于竞争对手。自今年以来,英伟达股价已累计上涨约97%,成为继微软和苹果之后市值最高的科技公司。分析师预计,英伟达上季度的销售额将增长243%。

16.斯嘉丽·约翰逊反对OpenAI,导致ChatGPT暂停类似她声音的选项

斯嘉丽·约翰逊近日对OpenAI表示强烈不满,因其新ChatGPT产品中使用了一个与她声音极其相似的选项。尽管九个月前她拒绝了OpenAI的配音请求,当听到这个声音选项时,约翰逊感到“震惊”和“愤怒”,因为声音与她的声音极其相似,以至于亲友和媒体都无法分辨。 在广泛反响和与她在电影《她》中AI伴侣角色的比较之后,OpenAI于周一撤回了这个名为“Sky”的声音选项。OpenAI在一篇博文中解释了“Sky”的创建过程,并强调该选项并非基于约翰逊的声音,同时重申了对配音行业的重视。 约翰逊表示,OpenAI CEO Sam Altman曾希望通过她的配音在科技公司和创意人士之间架起桥梁。在声音发布前,Altman再次联系她的代理人,要求她重新考虑此事。约翰逊的律师随后要求OpenAI移除该声音。 在几位安全团队顶级成员辞职后,公司最终撤回了“Sky”声音。关键研究员Jan Leike辞职,批评公司优先考虑“闪亮的产品”而非安全文化和流程。OpenAI还提到将与娱乐行业专业人士合作,并补偿配音演员的工作。AI公司尤其是OpenAI,因涉嫌侵犯版权及AI取代人类工作的担忧,一直面临娱乐行业的强烈反对和诉讼。主要娱乐工会如Sag-Aftra也因涉及AI使用其肖像的问题而进行罢工。

17.智源评测体系发布,百余大模型评估结果出炉

智源研究院发布了全新的智源评测体系,并公布了对140多个国内外开源和商业闭源大模型的评测结果。在语言模型方面,字节跳动豆包 Skylark2 和 OpenAI GPT-4 表现优异。多模态模型评测中,OpenAI DALL-E3 和 Sora 分别在文生图和文生视频能力上领先。此次评测还包括K12学科测试,结果显示大模型在综合学科能力上仍有提升空间。智源研究院将继续完善评测体系,推动大模型技术在多场景下的应用和发展。

18.AI在心智理论测试中表现超越人类

一项新的研究显示,大型语言模型(LLM),如OpenAI的GPT-4,在模仿心智理论(理解他人心理状态的能力)方面表现出色,甚至超越了人类。研究由德国汉堡-埃普多夫大学的Cristina Becchio教授及其团队进行,发表在《自然人类行为》期刊上。 测试内容包括理解暗示、讽刺、失礼行为、错误信念和复杂故事情节。结果显示,GPT-4在大多数任务中的表现优于人类,仅在失礼行为测试中稍逊一筹。 研究团队谨慎指出,这并不意味着LLM真正具备了心智理论能力,而是展示出与人类相似的行为表现。尽管一些专家对此结果持保留态度,认为应避免引发过度期待和恐慌,但研究表明,LLM在模拟人类心理理解方面具有潜力。 这一发现对AI与人类用户的互动和需求预测提出了新的思考,同时也引发了对AI可能用于操纵和欺骗的担忧。

关注「阿杰与AI」公众号

与AI时代更靠近一点