AI Daily | AI日报：腾讯混元挖微软大模型团队; OpenAI开放GPT - 4.1; Gartner：生成式AI难取代工程师

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-05-15 资讯日报

新闻资讯

腾讯混元挖微软大模型团队

腾讯混元挖走微软WizardLM明星团队，其新作Hunyuan - Turbos跻身大模型竞技场前10。此前WizardLM - 2发布不顺，微软又将大裁员，国内大厂正疯狂抢夺大模型人才。>阅读原文

OpenAI开放GPT - 4.1

OpenAI：凌晨开放GPT - 4.1，支持100万tokens上下文，编码、多模态处理等能力强，价格更优，Plus等用户先能用，企业和教育用户后续有访问权限。>阅读原文

Gartner：生成式AI难取代工程师

Gartner分析师Haritha：生成式AI不会取代软件工程师，能提效。招聘上可简化流程、加快速度。领导者可通过技能管理、构建学习文化、制定伦理政策助团队成功。>阅读原文

DHH：写代码不应全外包给AI

前OpenAI研究员提出“氛围编程”，开发者借此变现。DHH赞赏AI辅助，反对全外包，认为编程应是享受。网友看法不一，有人盼AI帮忙，有人愿掌握主导权。>阅读原文

GPT - 4.1上线，网友实测很失望

OpenAI：GPT - 4.1在ChatGPT可用。实测它代码处理能力强、速度快，推理表现优，但网友吐槽：没100万上下文窗口API版，太失望，只能盼GPT - 5了。>阅读原文

AI暴露研报行业乱象

数字生命卡兹克：一份高价煤炭研报闹笑话，很多人以为是AI写的，实际是人类复制粘贴的结果。AI暴露了行业乱象，真正的专业是对信息质量的敬畏。>阅读原文

GPT - 4.1全用户免费登录ChatGPT

OpenAI：从今天凌晨起，GPT - 4.1在ChatGPT全用户免费使用。它推理效率高，实测速度快、更清爽，长上下文且性价比高，适合日常编码。>阅读原文

中国企业将算力设施送上太空

国星宇航“星算”计划首发星座发射成功，将开启“太空计算时代”。太空部署算力能节约成本、及时处理数据且更安全，未来与地面互补，中国在太空算力部署上领先。>阅读原文

DeepSeek R系列传言太离谱

网上疯传DeepSeek R2到R5突破消息，内容玄幻离谱。Anthropic联合创始人评价有褒有贬。当下闭源模型表现好，开源阵营寄望DeepSeek R2，大家应平常心待传言。>阅读原文

WizardLM团队转投腾讯混元

WizardLM团队创建者徐灿宣布团队离开微软加入腾讯混元。该团队专注大语言模型开发，成果亮眼却有部署难题。腾讯大力投资AI，网友认为这对微软是损失，也惋惜其离开开源领域。>阅读原文

云天励飞：华为猛下单的芯片黑马

云天励飞：2024年营收大增，市值超180亿。靠‘算法芯片化’在推理、行业、消费领域布局，推出适配主流大模型的芯片和加速卡，与华为合作推一体机，消费级业务也有进展。>阅读原文

Google推出AlphaEvolve颠覆领域

Google推出AlphaEvolve，可实现算法自我进化。它已发现更快矩阵乘法算法、解决数学问题，还优化了Google计算架构。未来有望在多领域应用，或催生新软件服务。>阅读原文

Anthropic将推新思考模型

Anthropic：未来几周将推Claude Sonnet和Claude Opus，可在思考与工具使用间切换、自检代码。虽之前产品有差评，但新模型处理复杂任务更优，更像人、趋于AGI。>阅读原文

3200+ Cursor用户遭恶意劫持

Socket研究人员：三个恶意npm软件包伪装‘最便宜Cursor API’，攻击Cursor编辑器macOS版，超3200用户被‘劫持’，凸显供应链威胁，开发者需小心。>阅读原文

奥特曼：OpenAI要推订阅制AI

奥特曼：OpenAI目标是打造核心AI订阅服务，ChatGPT将成深度个性化服务；2025年代理做主要工作，编码成主导，AI或助科学发现，机器人创造经济价值。>阅读原文

HiddenLayer：提示攻破主流大模型

HiddenLayer：一种跨模型「策略傀儡」提示能攻破主流大模型安全护栏，利用训练弱点，可生成有害内容、提取系统提示。大模型厂商需持续智能监控，如用AISec方案。>阅读原文

谷歌推AI基金助初创公司

谷歌：推出AI Futures Fund，为用DeepMind工具的初创企业提供技术、资金支持，包括提前用模型、专家指导等，未公布基金规模，相关企业可官网申请。>阅读原文

余凯：谈智能驾驶战略思考

地平线余凯：公司战略要在无竞争处竞争、不冒险；智能驾驶像手机基带，重功能价值；AI时代产品逻辑异于互联网；技术变革要以高打低；警惕技术“平权陷阱”；高阶智驾前提是L2全场景辅助驾驶。>阅读原文

产品应用

mem0推OpenMemory MCP破记忆孤岛

mem0推出OpenMemory MCP，解决跨AI工具的记忆共享问题。它本地运行保障隐私，功能实用，获用户积极反馈，有望改善用户与AI交互体验，成为基础服务。>阅读原文

Gemini：超长上下文+强生态优势

黄益贺：现在是入手Gemini好时机，有教育优惠。Gemini上下文长度达100万且将扩展，处理大文档能力强；与Google产品生态打通，处理YouTube视频、文档表格等更方便，OpenAI下半场有压力。>阅读原文

陶哲轩联手DeepMind推AlphaEvolve

谷歌DeepMind与陶哲轩合作推出AlphaEvolve，可优化计算、调度数据中心、加速模型训练，还解决了300年几何难题，未来有望在多领域带来变革。>阅读原文

OpenMemory MCP打通多AI工具

mem0团队Taranjeet：OpenMemory MCP是为MCP兼容客户端打造的私有记忆层。它解决AI工具上下文丢失问题，通吃主流客户端，数据私密。不过未来扩展性待解决，但方向已现。>阅读原文

字节Seed1.5-VL揽38项SOTA

火山引擎：在上海巡展发布5款模型和产品，Seed1.5-VL激活参数20B，性能强，38个评测基准达SOTA，推理成本低，已开放API，重塑多模态交互方式。>阅读原文

谷歌发布超强AI Agent AlphaEvolve

谷歌：发布编程AI Agent AlphaEvolve，与Gemini集成。它能解决数学难题、提出新算法，提升大模型计算效率，还可优化GPU指令，架构多模块协作，科研等领域可申请使用。>阅读原文

快手字节百度新推 AI 产品

本期盘点：快手上线电商 AI 图像编辑产品 Poify；字节推出全链路内容制作平台 Pippit，功能丰富还拿月榜第一；百度又推 AI 虚拟陪伴产品月匣，海外也有类似产品在做。>阅读原文

开源动态

MLSys2025：FlashInfer等获最佳论文奖

MLSys 2025公布最佳论文奖，FlashInfer和《The Hidden Bloat in Machine Learning Systems》入选。FlashInfer优化LLM推理性能，另一论文提出Negativa - ML消除ML框架臃肿，效果显著。>阅读原文

Moxin-7B：开源小模型大能量

东北大学等团队开发的Moxin-7B，全流程开源。它训练成本低至16万美元，性能比肩主流LLM，在多任务评测中表现出色，证明强化学习对7B小模型有效，降低研究门槛。>阅读原文

阿里Qwen3技术报告亮点多

阿里：Qwen3技术报告发布。它有密集和混合专家模型架构，预训练数据量翻倍、语种增多，后训练用强到弱蒸馏，各模型在多方面表现佳，旗舰模型竞争力强。>阅读原文

Qwen3技术报告首次全公开

通义千问：Qwen3技术报告全公开。它整合思考与非思考模式，引入预算机制，降低轻量级模型资源。在多测试领先，多语言支持扩至119种。后续将扩大预训练、改进架构及增加强化学习投入。>阅读原文

OmniAudio：360视频生成3D音频

OmniAudio团队：传统视频转音频技术难满足3D声音定位需求，为此提出360V2SA任务，构建Sphere360数据集。OmniAudio成果显著，但复杂场景识别有挑战，未来会继续探索。>阅读原文

Qwen3训练秘籍及新功能曝光

Qwen3技术报告公布，采用双模式架构，训练分多阶段，还“大带小”蒸馏数据。其融合思考与非思考模式，按问题复杂程度分配算力。此外，Qwen Chat全量上线深度研究功能。>阅读原文

微软开源多智能体自动化系统

微软：开源多智能体自定义自动化工作流系统，整合Azure服务构建智能管道。能让企业用AI智能体自动化处理复杂任务，有聚焦价值等功能，还提供部署指南与成本参考。>阅读原文

OpenMemory MCP：AI工具共享记忆

OpenMemory MCP：解决AI工具记忆痛点，实现不同工具共享上下文，支持100%本地运行，有跨平台、标准化操作等功能，研发团队经验丰富。>阅读原文

ruoyi - ai：开源AI框架提效300%

ruoyi - ai开源平台：集成前沿模型，有聊天、绘画等功能，支持企业级部署。技术架构优，实战能让内容生产效率提升5倍，相比同类有独特优势。>阅读原文

算法论文

浙大：Transformer助力翼型流动控制

浙江大学团队：提出基于Transformer的主动流动控制策略学习框架，将强化学习与气动优化结合。在翼型流动分离实验中表现佳，集成后显著提高设计效率，为流动控制和气动设计提供新方法。>阅读原文

北大人大团队突破机器人动作生成

北大和人大团队：首创通用动作生成框架Being - M0，构建百万级数据集MotionLib，研发文本驱动模型实现人体到机器人动作迁移，验证‘大数据+大模型’可行性，未来让机器人能力更强。>阅读原文

ICML 2025：新策略防模型崩溃

上交大等团队在ICML 2025提出Token - Level Editing策略。合成数据用多会致模型崩溃，该方法通过微编辑构建半合成数据，实验显示在各训练阶段能提升模型表现，有落地潜力。>阅读原文

技术文章

1. 调JVM参数提系统可用率

作者针对高并发系统不稳定问题，排查出是索引切换时GC压力大。通过调整JVM参数、升级JDK等优化，最后用分批断流发布+Eden区“预热”实现索引无感切换，让系统可用率从95%提至99.995%。>阅读原文