All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-15 资讯日报
新闻资讯
腾讯混元挖微软大模型团队
腾讯混元挖走微软WizardLM明星团队,其新作Hunyuan - Turbos跻身大模型竞技场前10。此前WizardLM - 2发布不顺,微软又将大裁员,国内大厂正疯狂抢夺大模型人才。>阅读原文
OpenAI开放GPT - 4.1
OpenAI:凌晨开放GPT - 4.1,支持100万tokens上下文,编码、多模态处理等能力强,价格更优,Plus等用户先能用,企业和教育用户后续有访问权限。>阅读原文
Gartner:生成式AI难取代工程师
Gartner分析师Haritha:生成式AI不会取代软件工程师,能提效。招聘上可简化流程、加快速度。领导者可通过技能管理、构建学习文化、制定伦理政策助团队成功。>阅读原文
DHH:写代码不应全外包给AI
前OpenAI研究员提出“氛围编程”,开发者借此变现。DHH赞赏AI辅助,反对全外包,认为编程应是享受。网友看法不一,有人盼AI帮忙,有人愿掌握主导权。>阅读原文
GPT - 4.1上线,网友实测很失望
OpenAI:GPT - 4.1在ChatGPT可用。实测它代码处理能力强、速度快,推理表现优,但网友吐槽:没100万上下文窗口API版,太失望,只能盼GPT - 5了。>阅读原文
AI暴露研报行业乱象
数字生命卡兹克:一份高价煤炭研报闹笑话,很多人以为是AI写的,实际是人类复制粘贴的结果。AI暴露了行业乱象,真正的专业是对信息质量的敬畏。>阅读原文
GPT - 4.1全用户免费登录ChatGPT
OpenAI:从今天凌晨起,GPT - 4.1在ChatGPT全用户免费使用。它推理效率高,实测速度快、更清爽,长上下文且性价比高,适合日常编码。>阅读原文
中国企业将算力设施送上太空
国星宇航“星算”计划首发星座发射成功,将开启“太空计算时代”。太空部署算力能节约成本、及时处理数据且更安全,未来与地面互补,中国在太空算力部署上领先。>阅读原文
DeepSeek R系列传言太离谱
网上疯传DeepSeek R2到R5突破消息,内容玄幻离谱。Anthropic联合创始人评价有褒有贬。当下闭源模型表现好,开源阵营寄望DeepSeek R2,大家应平常心待传言。>阅读原文
WizardLM团队转投腾讯混元
WizardLM团队创建者徐灿宣布团队离开微软加入腾讯混元。该团队专注大语言模型开发,成果亮眼却有部署难题。腾讯大力投资AI,网友认为这对微软是损失,也惋惜其离开开源领域。>阅读原文
云天励飞:华为猛下单的芯片黑马
云天励飞:2024年营收大增,市值超180亿。靠‘算法芯片化’在推理、行业、消费领域布局,推出适配主流大模型的芯片和加速卡,与华为合作推一体机,消费级业务也有进展。>阅读原文
Google推出AlphaEvolve颠覆领域
Google推出AlphaEvolve,可实现算法自我进化。它已发现更快矩阵乘法算法、解决数学问题,还优化了Google计算架构。未来有望在多领域应用,或催生新软件服务。>阅读原文
Anthropic将推新思考模型
Anthropic:未来几周将推Claude Sonnet和Claude Opus,可在思考与工具使用间切换、自检代码。虽之前产品有差评,但新模型处理复杂任务更优,更像人、趋于AGI。>阅读原文
3200+ Cursor用户遭恶意劫持
Socket研究人员:三个恶意npm软件包伪装‘最便宜Cursor API’,攻击Cursor编辑器macOS版,超3200用户被‘劫持’,凸显供应链威胁,开发者需小心。>阅读原文
奥特曼:OpenAI要推订阅制AI
奥特曼:OpenAI目标是打造核心AI订阅服务,ChatGPT将成深度个性化服务;2025年代理做主要工作,编码成主导,AI或助科学发现,机器人创造经济价值。>阅读原文
HiddenLayer:提示攻破主流大模型
HiddenLayer:一种跨模型「策略傀儡」提示能攻破主流大模型安全护栏,利用训练弱点,可生成有害内容、提取系统提示。大模型厂商需持续智能监控,如用AISec方案。>阅读原文
谷歌推AI基金助初创公司
谷歌:推出AI Futures Fund,为用DeepMind工具的初创企业提供技术、资金支持,包括提前用模型、专家指导等,未公布基金规模,相关企业可官网申请。>阅读原文
余凯:谈智能驾驶战略思考
地平线余凯:公司战略要在无竞争处竞争、不冒险;智能驾驶像手机基带,重功能价值;AI时代产品逻辑异于互联网;技术变革要以高打低;警惕技术“平权陷阱”;高阶智驾前提是L2全场景辅助驾驶。>阅读原文
产品应用
mem0推OpenMemory MCP破记忆孤岛
mem0推出OpenMemory MCP,解决跨AI工具的记忆共享问题。它本地运行保障隐私,功能实用,获用户积极反馈,有望改善用户与AI交互体验,成为基础服务。>阅读原文
Gemini:超长上下文+强生态优势
黄益贺:现在是入手Gemini好时机,有教育优惠。Gemini上下文长度达100万且将扩展,处理大文档能力强;与Google产品生态打通,处理YouTube视频、文档表格等更方便,OpenAI下半场有压力。>阅读原文
陶哲轩联手DeepMind推AlphaEvolve
谷歌DeepMind与陶哲轩合作推出AlphaEvolve,可优化计算、调度数据中心、加速模型训练,还解决了300年几何难题,未来有望在多领域带来变革。>阅读原文
OpenMemory MCP打通多AI工具
mem0团队Taranjeet:OpenMemory MCP是为MCP兼容客户端打造的私有记忆层。它解决AI工具上下文丢失问题,通吃主流客户端,数据私密。不过未来扩展性待解决,但方向已现。>阅读原文
字节Seed1.5-VL揽38项SOTA
火山引擎:在上海巡展发布5款模型和产品,Seed1.5-VL激活参数20B,性能强,38个评测基准达SOTA,推理成本低,已开放API,重塑多模态交互方式。>阅读原文
谷歌发布超强AI Agent AlphaEvolve
谷歌:发布编程AI Agent AlphaEvolve,与Gemini集成。它能解决数学难题、提出新算法,提升大模型计算效率,还可优化GPU指令,架构多模块协作,科研等领域可申请使用。>阅读原文
快手字节百度新推 AI 产品
本期盘点:快手上线电商 AI 图像编辑产品 Poify;字节推出全链路内容制作平台 Pippit,功能丰富还拿月榜第一;百度又推 AI 虚拟陪伴产品月匣,海外也有类似产品在做。>阅读原文
推荐文章
左耳朵耗子:技术创业与成长之道
左耳朵耗子:创业因市场对技术有需求,选流量网关和监控;技术应用于创新,学基础很重要;选主流技术;成长要找对方向和人,管理好时间,带着问题学。>阅读原文
InfoQ 2025 软件架构趋势报告
InfoQ 报告指出,2025 年软件架构设计有诸多趋势。LLM 普及但应用不明,Agentic AI、SLM 属创新者阶段,RAG 是早期采用者,AI 辅助开发到早期大众,还有绿色软件等创新趋势。>阅读原文
小枣君揭秘英伟达产品体系
小枣君:英伟达产品体系丰富,算力芯片如V100等按架构命名;超级芯片由GPU和CPU配对;还有超级计算机平台。通信有NVLINK等技术,CUDA是核心开发框架,在AI领域地位牢固。>阅读原文
尹一峰揭秘RAG系统设计策略
尹一峰:RAG可解决LLM训练成本高和幻觉问题,本质是提示工程。语义搜索灵活但缺结构,设计RAG系统要权衡各方面。KG - RAG强大但成本高,Lazy Graph RAG结合两者优点降成本。>阅读原文
开源动态
MLSys2025:FlashInfer等获最佳论文奖
MLSys 2025公布最佳论文奖,FlashInfer和《The Hidden Bloat in Machine Learning Systems》入选。FlashInfer优化LLM推理性能,另一论文提出Negativa - ML消除ML框架臃肿,效果显著。>阅读原文
Moxin-7B:开源小模型大能量
东北大学等团队开发的Moxin-7B,全流程开源。它训练成本低至16万美元,性能比肩主流LLM,在多任务评测中表现出色,证明强化学习对7B小模型有效,降低研究门槛。>阅读原文
阿里Qwen3技术报告亮点多
阿里:Qwen3技术报告发布。它有密集和混合专家模型架构,预训练数据量翻倍、语种增多,后训练用强到弱蒸馏,各模型在多方面表现佳,旗舰模型竞争力强。>阅读原文
Qwen3技术报告首次全公开
通义千问:Qwen3技术报告全公开。它整合思考与非思考模式,引入预算机制,降低轻量级模型资源。在多测试领先,多语言支持扩至119种。后续将扩大预训练、改进架构及增加强化学习投入。>阅读原文
OmniAudio:360视频生成3D音频
OmniAudio团队:传统视频转音频技术难满足3D声音定位需求,为此提出360V2SA任务,构建Sphere360数据集。OmniAudio成果显著,但复杂场景识别有挑战,未来会继续探索。>阅读原文
Qwen3训练秘籍及新功能曝光
Qwen3技术报告公布,采用双模式架构,训练分多阶段,还“大带小”蒸馏数据。其融合思考与非思考模式,按问题复杂程度分配算力。此外,Qwen Chat全量上线深度研究功能。>阅读原文
微软开源多智能体自动化系统
微软:开源多智能体自定义自动化工作流系统,整合Azure服务构建智能管道。能让企业用AI智能体自动化处理复杂任务,有聚焦价值等功能,还提供部署指南与成本参考。>阅读原文
OpenMemory MCP:AI工具共享记忆
OpenMemory MCP:解决AI工具记忆痛点,实现不同工具共享上下文,支持100%本地运行,有跨平台、标准化操作等功能,研发团队经验丰富。>阅读原文
ruoyi - ai:开源AI框架提效300%
ruoyi - ai开源平台:集成前沿模型,有聊天、绘画等功能,支持企业级部署。技术架构优,实战能让内容生产效率提升5倍,相比同类有独特优势。>阅读原文
算法论文
浙大:Transformer助力翼型流动控制
浙江大学团队:提出基于Transformer的主动流动控制策略学习框架,将强化学习与气动优化结合。在翼型流动分离实验中表现佳,集成后显著提高设计效率,为流动控制和气动设计提供新方法。>阅读原文
北大人大团队突破机器人动作生成
北大和人大团队:首创通用动作生成框架Being - M0,构建百万级数据集MotionLib,研发文本驱动模型实现人体到机器人动作迁移,验证‘大数据+大模型’可行性,未来让机器人能力更强。>阅读原文
ICML 2025:新策略防模型崩溃
上交大等团队在ICML 2025提出Token - Level Editing策略。合成数据用多会致模型崩溃,该方法通过微编辑构建半合成数据,实验显示在各训练阶段能提升模型表现,有落地潜力。>阅读原文
技术文章
1. 调JVM参数提系统可用率
作者针对高并发系统不稳定问题,排查出是索引切换时GC压力大。通过调整JVM参数、升级JDK等优化,最后用分批断流发布+Eden区“预热”实现索引无感切换,让系统可用率从95%提至99.995%。>阅读原文