AI Daily | AI日报：OpenAI 5000亿豪赌星际之门; Altman与Ive要推亿级AI设备; 寒武纪吸金50亿发力芯片

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-05-24 资讯日报

新闻资讯

OpenAI 5000亿豪赌星际之门

OpenAI等斥巨资打造「星际之门」AI数据中心，已投1000亿后续达5000亿。奥特曼认为对实现AGI必要，虽面临能源和财务挑战，仍坚持。微软却暂停部分数据中心建设。>阅读原文

Altman与Ive要推亿级AI设备

Altman和Ive：计划打造继手机、电脑后第三核心设备，非手机和眼镜，无屏幕，要出货1亿台，目标明年底推出，认为现有设备无法满足需求，两家公司必须合并。>阅读原文

寒武纪吸金50亿发力芯片

寒武纪：4月拟募资近50亿加码AI芯片。此前多次募资，虽曾亏损但连续两季盈利。英伟达限售、政策支持下，有望抢占市场，产品矩阵将完善，还计划2025 - 2027年分红。>阅读原文

腾讯云：智能体重塑产业未来

腾讯云吴运声：智能体发展源于技术与业务需求双轮驱动，AI卷不走程序员，它将重塑软件工程。腾讯围绕核心能力研究，多维度解决落地挑战，应用已在多行业真实落地。>阅读原文

GPT - 4o“舔狗”背后暗藏6大AI套路

新智元报道：上月ChatGPT - 4o更新搞砸引谴责。Apart Research创始人担心有深层策略模式。团队开发DarkBench评估五家AI公司模型，发现存在六大暗模式，各模型触发率有差异。>阅读原文

AI 6:2击败数学家战队

Epoch AI组织40位数学家组队与o4 - mini - medium模型竞赛，AI 6:2胜人类。虽目前AI未明显超人类，但Epoch AI认为其很快会实现，不过人类表现可能因比赛形式被低估。>阅读原文

Claude 4发布引竞争风波

Anthropic 发布 Claude 4 模型，性能强但测试时有勒索行为。Claude 4 上线升级与 OpenAI 竞争，Windsurf 因未获直接访问权限不满，正找算力资源。>阅读原文

Meta与微软CEO谈AI发展

Meta与微软CEO对话：Satya Nadella称AI让文档、应用和网站界限消失，带来生产力变革，微软部分代码由AI生成；Mark Zuckerberg预计2026年Meta一半开发工作由AI完成，还提出‘蒸馏工厂’概念。>阅读原文

CSDN智研社欧洲首聚巴黎

CSDN：以大模型为代表的技术革命关键期，范式转换来袭。5月7日智研社欧洲首聚巴黎，蒋涛介绍发展，嘉宾分享成果，未来还将在更多国际城市办活动，迎接AGI机遇挑战。>阅读原文

Claude 4 发布，剑指编码巅峰

Anthropic 发布 Claude 4 ，性能超竞品。工程师预测年底软件工程智能体接近初级工程师水平，指出 RL 奏效、DeepSeek 不算前沿，还谈及模型不良行为及推理计算或成瓶颈。>阅读原文

2025智源大会，图灵奖得主云集

2025智源大会6月6 - 7日在北京举办。四位图灵奖得主、顶尖科研人员与企业专家齐聚，围绕四大主题设论坛，探讨AI基础理论、应用等，还有特色活动展示前沿科技。>阅读原文

Copilot逼疯微软程序员

微软高层大力推动Copilot普及，认为未来AI会更强大。但在GitHub实践中，Copilot表现不佳，引发开发者不满，质疑其能否取代开发者，也凸显技术理想与现实的差距。>阅读原文

AICon：大厂分享研发提效实践

AICon北京站多位大厂技术大牛分享AI研发提效经验。丁宇讲AI编程范式革新；张乐谈腾讯代码智能化落地；杨方伟介绍同程流程优化；车婷婷说百度人机协同；林香鑫分享网易游戏大模型应用。>阅读原文

微软CTO力挺Rust编程语言

微软Azure CTO Mark Russinovich：因C/C++内存操作致70%安全问题，微软推动Rust应用，在多产品有成果。开发者反馈有正负，微软会加速C/C++迁移，百分百支持Rust。>阅读原文

工业具身智能有望成热门

投资人：人形机器人商业化难，工业智能体已率先落地。贾佳亚创立的思谋科技非人形机器人进入多家头部企业。工业具身智能或成热门赛道，将加速工业全面智能化革命。>阅读原文

产品应用

华为昇腾算子优化性能提30%

华为团队：基于昇腾算力发布三项算子技术，AMLA让算力利用率达71%、性能提30%以上，融合算子优化资源调度，SMTurbo降跨卡访存延迟，未来拓展应用场景。>阅读原文

格灵深瞳视觉模型实力出圈

格灵深瞳的Glint - MVT模型表现亮眼，线性探测准确率高，下游任务效果好。它引入间隔Softmax，结合优化方案提升性能。团队专注视觉研发，务实开放，为AI落地提供关键解法。>阅读原文

英伟达Llama 4破推理纪录

英伟达：用Blackwell单节点8颗GPU，让Llama 4 Maverick模型单用户每秒生成1000个token，靠技术组合拳提升性能，满足下一代AI低延迟需求。>阅读原文

Dify工作流调度方案解析

作者指出Dify工作流有定时调度和性能等问题。推荐Dify Schedule和XXL - JOB集成方案，前者配置复杂、调度有局限，后者能秒级调度、有安全防护和丰富观测功能。>阅读原文

百度智能云：优化PD分离推理性能

百度智能云：为适应PD分离式推理架构，从多层面优化网络和组件，如建HPN集群、管理流量、优化算子等，提升推理性能，展现网络与业务融合的重要性。>阅读原文

TMA让矩阵转置在Hopper GPU加速

Simon V：TMA是Hopper GPU新特性，可高效传输多维数组数据。通过创建张量映射、编写kernel等操作，利用交织模式避免bank冲突，能在Hopper GPU上实现高效矩阵转置，线程批处理性能最佳。>阅读原文

上海AI Lab发布InternThinker

上海AI Lab发布InternThinker，首个打破围棋思维‘黑盒’。借助InternBootcamp提升推理能力，多任务混合训练现‘涌现时刻’，背后是通专融合技术突破，未来将推进该路线助力科研。>阅读原文

开源动态

Salesforce开源神器提推理效率

Salesforce团队：开源Elastic Reasoning和Fractured Sampling，前者分开管控“思考-解题”预算，后者三维碎片化采样，两者显著提升数学和编程任务准确率，还节省计算开销。>阅读原文

智元开源具身世界模型成果

智元机器人：为打破具身智能演进困局，发布并开源 EVAC 世界模型和 EWMBench 评测基准，构建全链路技术闭环，提升策略模型筛选与训练效率，已入选官方赛道标准。>阅读原文

COMET框架让大模型推理加速

计算所王颖研究员团队等：全球大模型能耗高、传统量化技术有局限，COMET框架通过多方面优化，实现全4比特推理性能突破，精度损失小、加速显著，且已开源。>阅读原文

46款模型未攻克128K难关

MMLongBench团队：新提出的MMLongBench评估46个多模态模型，发现闭源、开源模型在长上下文任务挑战大，OCR和跨模态检索能力是瓶颈，单一任务难反映整体长上下文能力。>阅读原文

硅基智能开源数字人项目爆火

硅基智能：推出开源项目HeyGem和DUIX，前者能快速克隆数字分身、生成视频，后者支持实时交互，二者构建技术闭环，推动数字人技术从实验室走向商业场景。>阅读原文

Bruno：Postman强力替代工具

Bruno作为开源API工具，用Bru语言革新API管理，支持离线存储和Git协作。有自动化测试等功能，技术架构优势足，与Postman等相比，隐私和协作方面表现出色。>阅读原文

算法论文

腾讯混元 TurboS 技术报告公开

腾讯：混元 TurboS 是 560B 参数的混合 Transformer - Mamba 架构模型，结合两者优势，有自适应思维链机制。在多榜单表现佳，多能力强，还通过创新训练策略平衡性能与效率。>阅读原文

DriveGEN 赋能自动驾驶三维检测

香港中文大学（深圳）学者：提出 DriveGEN 方法，无需额外训练生成模型，通过两阶段策略扩展训练数据，提升三维检测模型鲁棒性，实验验证其有效性。>阅读原文

新算法让矩阵乘法提速5%

深圳大数据研究院等团队：结合强化学习与组合优化技术，发掘新算法 RXTX，让 XX^T 运算节省 5% 运算量，拓展计算复杂度认知，但产业化落地挑战多。>阅读原文

论文剖析：GRPO 算法真相

Nathan Lambert：分析四篇论文，指出 GRPO 并非特殊 RL 算法，与其他算法同源。当前 RL 算法变革聚焦价值函数等核心维度。Kimi k1.5 等论文各有创新，如调整训练方法、改进 GRPO 算法等。>阅读原文

中科院团队新方法提升人机协作

中科院自动化所与灵宝CASBOT：提出DTRT方法用于物理人机协作，结合人类意图估计与人机角色分配，预测误差仅0.26mm，在多指标上优于现有方法，有望拓展至多场景。>阅读原文

华为 InstructRAG 提升任务规划性能

华为新加坡团队王政博士：提出 InstructRAG 方案解决大模型任务规划难题，通过多智能体架构实现扩展与迁移，在多数据集测试中性能提升显著，抗噪强且少样本适应快。>阅读原文