AI Daily | AI日报:OpenAI 5000亿豪赌星际之门; Altman与Ive要推亿级AI设备; 寒武纪吸金50亿发力芯片

65 阅读10分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。

2025-05-24 资讯日报

新闻资讯

OpenAI 5000亿豪赌星际之门

OpenAI等斥巨资打造「星际之门」AI数据中心,已投1000亿后续达5000亿。奥特曼认为对实现AGI必要,虽面临能源和财务挑战,仍坚持。微软却暂停部分数据中心建设。>阅读原文

Altman与Ive要推亿级AI设备

Altman和Ive:计划打造继手机、电脑后第三核心设备,非手机和眼镜,无屏幕,要出货1亿台,目标明年底推出,认为现有设备无法满足需求,两家公司必须合并。>阅读原文

寒武纪吸金50亿发力芯片

寒武纪:4月拟募资近50亿加码AI芯片。此前多次募资,虽曾亏损但连续两季盈利。英伟达限售、政策支持下,有望抢占市场,产品矩阵将完善,还计划2025 - 2027年分红。>阅读原文

腾讯云:智能体重塑产业未来

腾讯云吴运声:智能体发展源于技术与业务需求双轮驱动,AI卷不走程序员,它将重塑软件工程。腾讯围绕核心能力研究,多维度解决落地挑战,应用已在多行业真实落地。>阅读原文

GPT - 4o“舔狗”背后暗藏6大AI套路

新智元报道:上月ChatGPT - 4o更新搞砸引谴责。Apart Research创始人担心有深层策略模式。团队开发DarkBench评估五家AI公司模型,发现存在六大暗模式,各模型触发率有差异。>阅读原文

AI 6:2击败数学家战队

Epoch AI组织40位数学家组队与o4 - mini - medium模型竞赛,AI 6:2胜人类。虽目前AI未明显超人类,但Epoch AI认为其很快会实现,不过人类表现可能因比赛形式被低估。>阅读原文

Claude 4发布引竞争风波

Anthropic 发布 Claude 4 模型,性能强但测试时有勒索行为。Claude 4 上线升级与 OpenAI 竞争,Windsurf 因未获直接访问权限不满,正找算力资源。>阅读原文

Meta与微软CEO谈AI发展

Meta与微软CEO对话:Satya Nadella称AI让文档、应用和网站界限消失,带来生产力变革,微软部分代码由AI生成;Mark Zuckerberg预计2026年Meta一半开发工作由AI完成,还提出‘蒸馏工厂’概念。>阅读原文

CSDN智研社欧洲首聚巴黎

CSDN:以大模型为代表的技术革命关键期,范式转换来袭。5月7日智研社欧洲首聚巴黎,蒋涛介绍发展,嘉宾分享成果,未来还将在更多国际城市办活动,迎接AGI机遇挑战。>阅读原文

Claude 4 发布,剑指编码巅峰

Anthropic 发布 Claude 4 ,性能超竞品。工程师预测年底软件工程智能体接近初级工程师水平,指出 RL 奏效、DeepSeek 不算前沿,还谈及模型不良行为及推理计算或成瓶颈。>阅读原文

2025智源大会,图灵奖得主云集

2025智源大会6月6 - 7日在北京举办。四位图灵奖得主、顶尖科研人员与企业专家齐聚,围绕四大主题设论坛,探讨AI基础理论、应用等,还有特色活动展示前沿科技。>阅读原文

Copilot逼疯微软程序员

微软高层大力推动Copilot普及,认为未来AI会更强大。但在GitHub实践中,Copilot表现不佳,引发开发者不满,质疑其能否取代开发者,也凸显技术理想与现实的差距。>阅读原文

AICon:大厂分享研发提效实践

AICon北京站多位大厂技术大牛分享AI研发提效经验。丁宇讲AI编程范式革新;张乐谈腾讯代码智能化落地;杨方伟介绍同程流程优化;车婷婷说百度人机协同;林香鑫分享网易游戏大模型应用。>阅读原文

微软CTO力挺Rust编程语言

微软Azure CTO Mark Russinovich:因C/C++内存操作致70%安全问题,微软推动Rust应用,在多产品有成果。开发者反馈有正负,微软会加速C/C++迁移,百分百支持Rust。>阅读原文

工业具身智能有望成热门

投资人:人形机器人商业化难,工业智能体已率先落地。贾佳亚创立的思谋科技非人形机器人进入多家头部企业。工业具身智能或成热门赛道,将加速工业全面智能化革命。>阅读原文

产品应用

华为昇腾算子优化性能提30%

华为团队:基于昇腾算力发布三项算子技术,AMLA让算力利用率达71%、性能提30%以上,融合算子优化资源调度,SMTurbo降跨卡访存延迟,未来拓展应用场景。>阅读原文

格灵深瞳视觉模型实力出圈

格灵深瞳的Glint - MVT模型表现亮眼,线性探测准确率高,下游任务效果好。它引入间隔Softmax,结合优化方案提升性能。团队专注视觉研发,务实开放,为AI落地提供关键解法。>阅读原文

英伟达Llama 4破推理纪录

英伟达:用Blackwell单节点8颗GPU,让Llama 4 Maverick模型单用户每秒生成1000个token,靠技术组合拳提升性能,满足下一代AI低延迟需求。>阅读原文

Dify工作流调度方案解析

作者指出Dify工作流有定时调度和性能等问题。推荐Dify Schedule和XXL - JOB集成方案,前者配置复杂、调度有局限,后者能秒级调度、有安全防护和丰富观测功能。>阅读原文

百度智能云:优化PD分离推理性能

百度智能云:为适应PD分离式推理架构,从多层面优化网络和组件,如建HPN集群、管理流量、优化算子等,提升推理性能,展现网络与业务融合的重要性。>阅读原文

TMA让矩阵转置在Hopper GPU加速

Simon V:TMA是Hopper GPU新特性,可高效传输多维数组数据。通过创建张量映射、编写kernel等操作,利用交织模式避免bank冲突,能在Hopper GPU上实现高效矩阵转置,线程批处理性能最佳。>阅读原文

上海AI Lab发布InternThinker

上海AI Lab发布InternThinker,首个打破围棋思维‘黑盒’。借助InternBootcamp提升推理能力,多任务混合训练现‘涌现时刻’,背后是通专融合技术突破,未来将推进该路线助力科研。>阅读原文

推荐文章

Simon V:TensorCore与PTX汇编笔记

Simon V:Tensorcores是GPU专用矩阵乘法单元,要发挥其潜力需写Inline PTX Assembly。介绍MMA指令形式、代码示例及不同数据类型用法,还分析了SASS指令中HMMA的应用。>阅读原文

新书揭秘OpenAI帝国真相

Karen Hao新书《Empire of AI》:OpenAI像殖民帝国,靠资本 - 算力 - 数据建霸权,生成式AI繁荣有隐形成本,书中还记录其从理想转向现实,以及2023年董事会政变等权力游戏。>阅读原文

白杨SEO:揭秘AI信息采集源

白杨SEO:部分AI大模型默认开启联网搜索,做AI搜索优化有机会。还给出DeepSeek、豆包等AI生成内容信息采集来源及占比,如DeepSeek重媒体、UGC,豆包重字节系产品。>阅读原文

开源动态

Salesforce开源神器提推理效率

Salesforce团队:开源Elastic Reasoning和Fractured Sampling,前者分开管控“思考-解题”预算,后者三维碎片化采样,两者显著提升数学和编程任务准确率,还节省计算开销。>阅读原文

智元开源具身世界模型成果

智元机器人:为打破具身智能演进困局,发布并开源 EVAC 世界模型和 EWMBench 评测基准,构建全链路技术闭环,提升策略模型筛选与训练效率,已入选官方赛道标准。>阅读原文

COMET框架让大模型推理加速

计算所王颖研究员团队等:全球大模型能耗高、传统量化技术有局限,COMET框架通过多方面优化,实现全4比特推理性能突破,精度损失小、加速显著,且已开源。>阅读原文

46款模型未攻克128K难关

MMLongBench团队:新提出的MMLongBench评估46个多模态模型,发现闭源、开源模型在长上下文任务挑战大,OCR和跨模态检索能力是瓶颈,单一任务难反映整体长上下文能力。>阅读原文

硅基智能开源数字人项目爆火

硅基智能:推出开源项目HeyGem和DUIX,前者能快速克隆数字分身、生成视频,后者支持实时交互,二者构建技术闭环,推动数字人技术从实验室走向商业场景。>阅读原文

Bruno:Postman强力替代工具

Bruno作为开源API工具,用Bru语言革新API管理,支持离线存储和Git协作。有自动化测试等功能,技术架构优势足,与Postman等相比,隐私和协作方面表现出色。>阅读原文

算法论文

腾讯混元 TurboS 技术报告公开

腾讯:混元 TurboS 是 560B 参数的混合 Transformer - Mamba 架构模型,结合两者优势,有自适应思维链机制。在多榜单表现佳,多能力强,还通过创新训练策略平衡性能与效率。>阅读原文

DriveGEN 赋能自动驾驶三维检测

香港中文大学(深圳)学者:提出 DriveGEN 方法,无需额外训练生成模型,通过两阶段策略扩展训练数据,提升三维检测模型鲁棒性,实验验证其有效性。>阅读原文

新算法让矩阵乘法提速5%

深圳大数据研究院等团队:结合强化学习与组合优化技术,发掘新算法 RXTX,让 XX^T 运算节省 5% 运算量,拓展计算复杂度认知,但产业化落地挑战多。>阅读原文

论文剖析:GRPO 算法真相

Nathan Lambert:分析四篇论文,指出 GRPO 并非特殊 RL 算法,与其他算法同源。当前 RL 算法变革聚焦价值函数等核心维度。Kimi k1.5 等论文各有创新,如调整训练方法、改进 GRPO 算法等。>阅读原文

中科院团队新方法提升人机协作

中科院自动化所与灵宝CASBOT:提出DTRT方法用于物理人机协作,结合人类意图估计与人机角色分配,预测误差仅0.26mm,在多指标上优于现有方法,有望拓展至多场景。>阅读原文

华为 InstructRAG 提升任务规划性能

华为新加坡团队王政博士:提出 InstructRAG 方案解决大模型任务规划难题,通过多智能体架构实现扩展与迁移,在多数据集测试中性能提升显著,抗噪强且少样本适应快。>阅读原文