AI日报-20250707:Meta新注意力机制,突破Transformer性能;OpenAI重磅官宣GPT5,推理+多模态!

184 阅读12分钟
1、星动纪元狂揽5亿融资!人形机器人技术突破引爆全球市场
2、中国团队开源AI记忆操作系统MemOS,彻底解决大模型"失忆症"难题
3、硅基智能完成D轮融资,数字人业务营收数亿,服务超50万用户
4、高德地图AI版震撼内测:空间智能落地,千人千面出行体验来袭
5、Meta新注意力机制震撼发布!Transformer性能上限被突破,OpenAI技术立功
6、B站重磅推出"代号H"AI神器!视频播客创作效率飙升400%
7、EarthMind开源大模型震撼发布:地球观测数据迎来AI分析新时代
8、Gemini CLI大更新!音视频+隐私双升级,开发者效率飙升
9、OpenAI另辟蹊径!21万年薪+福利招募非科班AI研究员
10、英伟达4亿美元收购AI新锐CentML,95后华人团队闪耀硅谷
11、OpenAI重磅官宣:GPT-5将融合推理与多模态,今夏震撼来袭
12、腾讯开源"混元-A13B"大模型:动态推理技术引领AI"会思考"革命
13、智元发布"哪吒机器人灵犀X2-N":轮足双形态切换黑科技震撼登场
14、Claude Neptune v3模型即将震撼发布!数学能力直逼行业顶尖水平
15Stream-Omni横空出世!中科院打造文本-视觉-语音三合一AI神器
16、飞渡科技"峥嵘大模型"震撼发布:数字双胞胎技术迎来重大突破

1、星动纪元狂揽5亿融资!人形机器人技术突破引爆全球市场

星动纪元完成近5亿元A轮融资,由鼎晖VGC和海尔资本联合领投。公司专注人形机器人研发,已实现产品批量交付全球科技巨头,海外订单占比超50%,技术实力获行业高度认可。

核心亮点

🚀全球TOP10科技巨头中9家为其客户,产品批量交付超200台
🌐自研VLA模型ERA-42实现全身灵巧操作,跑步速度破3.6m/s纪录
🏆海外收入占比超50%,物流零售场景快速落地海尔/联想等头部企业

原文链接: mp.weixin.qq.com/s/2pRbdI-0m…


2、中国团队开源AI记忆操作系统MemOS,彻底解决大模型"失忆症"难题

国内顶尖团队联合研发的MemOS记忆操作系统正式开源,该系统通过分层记忆架构和统一调度机制,成功解决大模型长期存在的记忆缺失问题,让AI真正实现"记得住、改得了、学得快"。

核心亮点

🚀首创MemCube记忆原子单元,支持三种记忆形态灵活转换与统一管理
🌳突破性实现KV Cache标准化管理,推理响应速度最高提升94.2%
🍉在LoCoMo评测中全面超越OpenAI方案,F1分数提升近6个百分点

原文链接: mp.weixin.qq.com/s/GaXVkE--I…


3、硅基智能完成D轮融资,数字人业务营收数亿,服务超50万用户

AIGC独角兽硅基智能近日完成数亿元D轮融资,投资方为嘉兴高新区产业基金。公司聚焦AIGC数字人技术研发与商业化应用,已服务超50万用户,数字人业务营收达数亿规模。

核心亮点

🚀D轮融资数亿元,投资方为嘉兴高新区产业基金,加速技术市场化应用。
🌟数字人业务营收数亿,服务5000余家品牌,降低商家成本约80%。
🎯推出DUIX ONE多模态大模型,集成语音识别、合成等能力,提升交互真实感。

原文链接: mp.weixin.qq.com/s/n9TNO2fX1…


4、高德地图AI版震撼内测:空间智能落地,千人千面出行体验来袭

高德地图推出全新AI版本,率先将空间智能技术应用于导航场景,通过小高老师智能体实现个性化出行规划,实时响应复杂需求,重塑导航体验。

核心亮点

🚗小高老师智能体上线,i人p人出行需求一键解决,省去跨APP烦恼。
🌆时空决策能力升级,推荐景点、路线、穿搭等细节,覆盖全场景需求。
🚦AI导航超视距感知,预测红绿灯、车道拥堵,实现毫秒级安全预警。

原文链接: mp.weixin.qq.com/s/okK7Y0YSr…


5、Meta新注意力机制震撼发布!Transformer性能上限被突破,OpenAI技术立功

Meta推出名为2-Simplicial Transformer的新架构,通过修改标准注意力机制,让Transformer能更高效利用训练数据,突破当前大模型发展的数据瓶颈。该架构基于OpenAI的Triton技术,将标准点积注意力推广到三线性函数,在数学、编程等任务上表现更优。

核心亮点

🚀三元线性注意力机制突破传统,引入第三个向量增强复杂模式表达能力。
🐲基于OpenAI Triton技术实现520TFLOPS性能,计算效率大幅提升。
🌟缩放指数更高,模型性能随参数增加提升更快,数据有限场景优势明显。

原文链接: mp.weixin.qq.com/s/s1a2pTlWB…


6、B站重磅推出"代号H"AI神器!视频播客创作效率飙升400%

B站即将发布"代号H"AI创作工具,专为视频播客设计,可将千字内容自动生成视频的时间压缩至6分钟,未来还将缩短至3分钟。该工具支持文案和音频输入,适配多种模板,旨在助力音频和文字创作者快速转型视频化。

核心亮点

🎙️B站视频播客用户超4000万,消费时长同比激增270%,市场潜力巨大。
🌟"代号H"支持多格式输入,六分钟生成视频,未来效率还将翻倍提升。
🚀提供流量支持和免费场地等扶持政策,加速创作者视频化转型进程。

原文链接: www.aibase.com/zh/news/194…


7、EarthMind开源大模型震撼发布:地球观测数据迎来AI分析新时代

意大利特伦托大学联合德国高校团队推出开源多模态大模型EarthMind,专为处理复杂地球观测数据设计,通过创新技术实现多传感器数据融合与精准分析,为灾害监测和城市规划提供智能支持。

核心亮点

🌍首创空间注意力提示模块,显著提升像素级目标识别精度
🛰️突破性跨模态融合技术,实现光学与雷达数据协同分析
🌲多粒度编码器架构,同步处理图像级、区域级和像素级任务

原文链接: www.aibase.com/zh/news/194…


8、Gemini CLI大更新!音视频+隐私双升级,开发者效率飙升

谷歌开源命令行工具Gemini CLI迎来重大更新,新增音视频处理功能和隐私控制命令,兼容性全面提升。本次更新合并85个PR,51位贡献者参与,工具稳定性与用户体验显著提升。

核心亮点

🎥新增音视频处理能力,开发者可直接在终端操作多媒体文件,场景更丰富。
🔒引入/privacy隐私命令,用户可自主查看修改隐私设置,数据更安全。
🖥️支持VSCodium和Neovim编辑器集成,工作流无缝衔接,效率倍增。

原文链接: www.aibase.com/zh/news/194…


9、OpenAI另辟蹊径!21万年薪+福利招募非科班AI研究员

OpenAI推出"研究员驻留计划",以21万美元年薪吸引物理学、神经科学等相邻领域人才,通过六个月培养计划打造新兴AI力量,与Meta等公司的高薪挖角策略形成鲜明对比。

核心亮点

🌳年薪21万美元+搬迁福利,OpenAI用性价比策略吸引跨界人才
🐲六个月驻留期转化率100%,表现优异者直接获全职offer
🍉不设学历门槛但重技术能力,每年仅招30人打造精英培养模式

原文链接: www.aibase.com/zh/news/194…


10、英伟达4亿美元收购AI新锐CentML,95后华人团队闪耀硅谷

英伟达以4亿美元收购AI初创公司CentML,这家由95后华人王尚创立的公司专注于优化AI应用性能,其团队将全部加入英伟达,为CUDA工具链注入新活力。

核心亮点

🚀95后华人团队创立仅1年即被收购,展现惊人技术实力与市场价值。
🌐CentML独创AI模型优化方案,显著提升GPU性能与成本效益。
🏆创始人王尚曾任职英伟达,此次回归将负责关键AI系统软件管理。

原文链接: www.aibase.com/zh/news/194…


11、OpenAI重磅官宣:GPT-5将融合推理与多模态,今夏震撼来袭

OpenAI确认GPT-5将于今夏发布,该模型将整合当前O系列的推理能力和GPT系列的多模态功能,显著提升性能并减少用户切换模型的需求,实现技术突破性统一。

核心亮点

🚀GPT-5将合并两大技术路线,推理与多模态能力首次深度融合。
🌟模型性能全面提升,用户无需在不同功能模型间频繁切换。
🐸OpenAI高管透露,新模型将带来更流畅统一的AI使用体验。

原文链接: www.aibase.com/zh/news/194…


12、腾讯开源"混元-A13B"大模型:动态推理技术引领AI"会思考"革命

腾讯近日开源其创新语言模型"混元-A13B",该模型采用动态推理技术,能根据任务复杂度智能切换快速与深度思考模式,并支持256K超长上下文处理,在数学竞赛中表现优异。

核心亮点

🐲800亿参数MoE架构仅激活130亿,实现高效推理与资源优化
🌟动态推理技术自动切换快速/深度模式,支持手动控制思考深度
🧮STEM专项训练达2500亿token,数学竞赛准确率超87%领先行业

原文链接: www.aibase.com/zh/news/194…


13、智元发布"哪吒机器人灵犀X2-N":轮足双形态切换黑科技震撼登场

智元公司推出创新型机器人灵犀X2-N,具备轮式和足式双形态自由切换能力,可适应复杂地形并保持强大负载性能,展现出卓越的越障和移动能力。

核心亮点

🦾足式状态下可盲走上台阶,手持12斤重物仍稳健前行,负载能力惊人。
🛞轮式形态实现高效移动,能轻松应对单边桥、斜坡等复杂地形挑战。
🏋️‍♂️抗冲击能力极强,即使遭遇外部推搡也能稳如泰山,可靠性出众。

原文链接: www.aibase.com/zh/news/195…


14、Claude Neptune v3模型即将震撼发布!数学能力直逼行业顶尖水平

Anthropic正在内部测试代号为"Claude Neptune v3"的全新AI模型,该模型在数学推理能力上表现突出,可能成为Claude系列的重大突破。目前正处于红队测试阶段,重点验证其宪法AI系统的安全性和合规性。

核心亮点

🐱内部测试显示数学能力媲美OpenAI和Google的顶尖模型,引发行业期待。
🍉采用宪法AI系统强化安全测试,确保模型稳健性和合规性表现优异。
🌴可能优化上下文窗口和工具使用能力,专为复杂任务需求而设计。

原文链接: www.aibase.com/zh/news/195…


15、Stream-Omni横空出世!中科院打造文本-视觉-语音三合一AI神器

中国科学院计算技术研究所推出Stream-Omni多模态大模型,突破性实现文本、视觉、语音的灵活组合交互,为用户带来前所未有的自然交互体验。

核心亮点

🐲基于GPT-4o架构创新设计,支持语音交互实时文本转录,边听边看更高效。
🌳独创模态对齐技术,减少对三模态数据依赖,实现语义互补的高效交互。
🍉实验表现惊艳,视觉理解媲美专业模型,语音能力显著超越现有技术。

原文链接: www.aibase.com/zh/news/195…


16、飞渡科技"峥嵘大模型"震撼发布:数字双胞胎技术迎来重大突破

飞渡科技最新推出的"峥嵘大模型"在国际评测平台City3D中表现卓越,其建模精度和语义理解能力位居全球前列,为灾害模拟、文化遗产保护等领域带来革命性变革。

核心亮点

🏆在国际评测平台City3D中表现卓越,建模精度和语义理解能力全球领先
🚨可精准模拟自然灾害影响,助力政府和救援机构高效应急响应
🏛️为文化遗产保护提供精确数字化记录,助力修复与保护工作

原文链接: www.aibase.com/zh/news/195…


往期推荐:

AI日报-20250706:猫猫攻击让AI数学能力暴跌300%!GPT+Gemini+DeepSeek合体战力飙升30%!

AI日报-20250704:DeepSeek-R1增强版推理效率飙升200%!微信支付MCP震撼上线!

AI日报-20250703:DeepSeek-R2神秘现身?!游戏模型一句话生成GTA神作!

AI大白话之MCP

100+行业报告获取攻略【免费】