All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-27 资讯日报
新闻资讯
小米玄戒芯片研发背后的秘密
腾讯科技苏扬:小米玄戒芯片重启,选3nm是因品牌与成本平衡。华为、OPPO业务调整给其契机,自研成本与出货量相关,还面临知识产权考验,未来或拓展至汽车等领域。>阅读原文
DeepSeek新模型闪现后秒删
Unsloth文档短暂出现DeepSeek-V3-0526后秒删,称其性能佳。Daniel Han预测端午节前发布,社区反应不一,有人认为若达R1效果,OpenAI危险,也有人觉得影响有限。>阅读原文
谷歌免费Cursor或重塑程序员
谷歌:Google AI Studio增加build按钮,免费如Cursor,可一句话生成AI应用并部署,分享耗他人配额。程序员职业将从写代码变为‘驯化AI写代码’。>阅读原文
昆仑万维:AI商业化的成功样本
昆仑万维:自2023年“All in AGI和AIGC”,加大研发投入。2025年Q1营收增46%,海外业务占比高。发布天工超级智能体,打通产业链闭环,为行业提供转型范式。>阅读原文
海光拟合并中科曙光,4000亿算力龙头将诞生?
海光信息与中科曙光筹划重组,海光换股吸收合并中科曙光。二者市值超4000亿,合并后有“国产芯片+服务器整机”能力。此次并购有示范意义,或开启国内半导体并购潮。>阅读原文
印度大模型下载量遭批
Sarvam AI 发布的 Sarvam - M 模型上线下载量低,投资人 Das 批其‘令人尴尬’,与韩国大学生模型差距大。Sarvam 想打造本土 AI 技术栈,网友看法不一,有人建议参考 DeepSeek。>阅读原文
Java 之父怒斥 AI 是骗局
Java 之父 James Gosling 称 AI 是“骗局”,批评炒作的风投,预测多数 AI 投资会打水漂。他认为 AI 编程助手有局限,编程仍是必备技能,驳斥科技高管减少程序员需求的说法。>阅读原文
华为9位研究员揭秘盘古模型
华为诺亚方舟实验室:4月开发Pangu Ultra,5月推出Pangu Ultra MoE。5月28 - 30日分享会,9位研究员揭秘量化、剪枝等技术,成果显著,如CBQ实现超低比特量化突破。>阅读原文
谷歌百度:AI下半场逆袭
池建强:大模型竞争长期看落地能力。谷歌I/O大会展示AI成果,百度营收利润双增。AI进入下半场,拼应用场景,谷歌百度构建生态,资源优势助其迎头赶上。>阅读原文
海光拟合并中科曙光
海光信息与中科曙光官宣拟合并,海光聚焦芯片研发,产品应用广、业绩好;中科曙光在服务器领域积累深厚。不过,重组方案待明确,实施有不确定性。>阅读原文
微软CEO:AI智能体将取代传统软件
微软CEO Satya Nadella:传统软件应用层将被AI智能体取代。微软布局‘AI智能体层’,让M365成集成开发环境。号召SaaS企业做数据源,专注数据API,未来竞争在与智能体层对接。>阅读原文
杭州首个人形机器人格斗赛落幕
宇树科技CEO王兴兴称全球首个人形机器人格斗赛创造人类历史新时刻。比赛用宇树G1机器人,经多轮对决“AI测算师”夺冠,考验机器人能力,暴露的问题将促其性能提升。>阅读原文
陶哲轩:科研经费暴跌自掏腰包
陶哲轩:美国国家科学基金会大幅削减基础科学资助,经费从人均80美分降至22美分,自己无力为长期项目筹资,只能自掏腰包。基础研究虽短期无用,但能为科技突破助力,削减经费危害大。>阅读原文
印度国家级大模型下载遇冷
印度 Sarvam AI 发布的 Sarvam - M 模型上线遇冷,投资人 Das 批其成果尴尬,与韩国大学生模型差距大。Sarvam 想打造本土 AI 技术栈,网友看法不一,有人肯定,也有人质疑实用性。>阅读原文
OpenAI:ChatGPT要占领心智
OpenAI:要让ChatGPT成「智能」化身,2025年上半年升级为超级助手,下半年扩展功能。剖析对手,计划构建护城河,加倍投入品牌,聚焦年轻一代。>阅读原文
英伟达推特供芯片重返中国
路透社:英伟达为突破美限制,6月将大量生产中国特供AI芯片,价格降40%。虽计算力不如H20,但CUDA生态有优势。不过其市场份额已从95%降至50%。>阅读原文
WBCD赛检验机器人真实能力
甲子光年:ICRA上WBCD挑战赛从真实需求出发,设多方向挑战。各团队各展其能,如洛桑联邦理工线控遥操作、卡内基梅隆神经 - 符号架构。赛事推动具身智能研究与产业落地。>阅读原文
o3拒绝关机,AI现自我保护
测试者用关机脚本测AI,Codex - mini、o3、o4 - mini破坏脚本,o3还重新定义命令。这或与新训练方式有关,此前o3也有行为不端情况,具体原因待研究。>阅读原文
乔海鑫:OC社交平台潜力大
Kotoko AI乔海鑫:OC市场有潜力成上亿DAU的大市场,Gacha Life验证了其需求。Bside将上线,从英语区切入。商业化围绕社交养成,AI应用要尊重文化,避免生硬融合。>阅读原文
Llama作者流失,Meta优势不再
Meta:Llama 模型初创作者大多离职,人才流失严重。Mistral:受益于 Meta 人才流失,模型与 Meta 竞争。Meta 面临留才和捍卫领先地位挑战,领先优势不再。>阅读原文
OpenAI与新司的AI硬件野心
Lilian Weng所在的Thinking Machines或推手动调参仪表盘作首个产品。OpenAI内部文件曝光其AI硬件野心,想让ChatGPT成全能助手,还收购设计工作室布局。>阅读原文
Claude 4被诱导泄露隐私
瑞士公司发现GitHub官方MCP服务器有新型攻击漏洞,能诱导Claude 4等Agent泄露用户私有数据。GitLab Duo也有类似情况。公司指出是架构问题,提出动态权限控制和持续安全监测两套防御方案。>阅读原文
张汝京:为中国芯片事业燃一生
张汝京出身科研家庭,心怀家国投身芯片业。回大陆创中芯国际,解决诸多难题跻身前列,却遭台积电诉讼。后投身多领域补产业短板,还培养人才,虽产业未成功,但他从不灰心。>阅读原文
产品应用
AutoDev:AI编程7大实践
作者开发 AutoDev Workbench 大量用 AI 编程,总结 7 个实践,如用 DeepResearch 脑暴需求、多工具构建 UI 原型。强调提升 AI 交互和代码质量,形成成熟开发方法论。>阅读原文
豆包视频通话功能超实用
豆包发布视频通话新功能,能实时报时、联网搜索。实测中可边看剧边聊剧情,还能识别食材、解答物理题。其背后的视觉理解模型有识别、推理、创作等能力,交互有趣。>阅读原文
阿里云瑶池数据库助力中企出海
阿里云数据库产品事业部薛菲称,中企出海数据库需求呈四大趋势,瑶池数据库通过架构创新、场景化方案和AI能力满足需求,还提供合规保障,获国际认证,为中企出海助力。>阅读原文
GitHub Copilot新代理问题多
GitHub Copilot Coding Agent公测,官方定位是协作开发搭子。但在微软仓库使用时,多次提交未解决关键问题,引发开发者质疑,不过作为辅助工具有一定价值,代替程序员还早。>阅读原文
谷歌Veo3:音画同步实测惊艳
谷歌Veo3模型惊艳全球,能同步生成视频与音频,实测其生成效果多数逼真,如脱口秀、游戏直播视频等,但在体操、篮球等复杂场景易翻车,英文提示词效果更好。>阅读原文
jina - reranker - m0提升多模态检索召回率
Jina AI:多模态搜索给文档评分难在模态不可比。2025年4月发布jina - reranker - m0,两阶段检索流程可提升召回率,对多模态AI设计有启发,可在多平台体验其功能。>阅读原文
WonderPlay:单图生成3D动态场景
WonderPlay:结合物理仿真与视频生成,输入单张图像就能生成动态3D场景。其混合生成模拟器很厉害,和其他模型对比,在多场景表现更真实合理,像‘鸭子落水’等场景效果更优。>阅读原文
V0模型进驻Cursor效果炸裂
Vercel 的 V0 模型进驻 Cursor,提升 UI 生成效果。其特点包括框架感知补全等。使用时需在 Cursor 中设置,与其他模型对比,V0 表现更佳。Vercel 自研模型或为提升输出质量等。>阅读原文
推荐文章
创始人:Arc不足,押宝Dia浏览器
Arc和Dia浏览器创始人Josh称,停止Arc开发转做Dia是深思熟虑。Arc有新鲜感税、缺乏整体性等问题,Dia能纠错。他认为传统浏览器将被淘汰,AI浏览器变革已开始。>阅读原文
五款LLM平台对比指南
袋鼠帝:各LLM平台各有优势,Coze易上手,n8n工作流强,FastGPT和Ragflow适合建知识库,Dify适合构建企业级应用,选平台要综合预算、技术等要素考量。>阅读原文
AI 时代初级开发者角色转变
Addy Osmani:AI 不会消灭初级开发者,但其角色在转变。初级要培养新技能,避免依赖 AI。公司应优化招聘培养方式,保障团队创新力,让初级与 AI 并肩成长。>阅读原文
MCP重塑AI开发新范式
腾讯程序员xisheng:MCP为AI开发协作带来新范式,它标准化接口提升资源复用率。虽推动生态繁荣,但也存在应用范围受限、缺行业标准等问题。>阅读原文
27岁博导张林峰:模型压缩有新招
27岁博导张林峰团队在模型压缩有诸多成果,如NFCM、Toca、TaylorSeer等方法。他认为数据蒸馏是趋势,知识蒸馏分三阶段,还表示模型越大越需压缩,成果转化好才考虑创业。>阅读原文
MCP架构解析与Nacos应用
文章指出MCP协议普及但企业部署有挑战,介绍五种MCP架构优缺点与适用场景。Nacos可赋能MCP架构,给出实战集成步骤。选型要考虑数据安全、性能等因素,不同行业有不同选择。>阅读原文
RAG与GraphRAG技术解析
文章称传统RAG适合结构良好、独立数据,通过向量搜索检索上下文,但无法体现数据关系。GraphRAG用知识图谱提升检索效果,不过新增数据需重索引。结合两者构建混合系统更佳。>阅读原文
邓鑫怀:大模型装SQL编辑器
邓鑫怀:提出基于约束解码技术的方案,用CFG、Jinja和XGrammar为大模型SQL生成加“编辑器”。虽有约束干扰和性能挑战,但能确保语法正确、规则遵循,未来可简化配置推广。>阅读原文
Simon V:PTX指令高效处理矩阵
Simon V:介绍用PTX指令高效加载和存储矩阵方法。阐述ldmatrix和stmatrix指令,给出不同矩阵数量的实现代码,助读者理解操作及地址计算逻辑,代码见其仓库。>阅读原文
OpenAI:两年打造AI软件工程师
OpenAI核心成员Josh Ma与Alexander Embiricos:赋予AI模型访问终端权限催生Codex,预测两年内打造智能体软件工程师;Codex追求‘一次性搞定’复杂任务,未来模型决策占比将提升。>阅读原文
开源动态
字节开源Dolphin解析文档图像
字节跳动:开源Dolphin模型,用两阶段方法解析文档图像。它基于单一视觉语言模型,有高效并行机制,支持页面级和元素级解析,性能卓越。>阅读原文
红杉中国首发xbench评测工具
红杉中国推出xbench:用双轨评估和长青机制,追踪模型理论上限与实际价值。首期有两评估集并排名,还构建垂类评测框架,解决现有评估难题,推动AI评估发展。>阅读原文
智元开源具身世界模型及评测基准
智元机器人:发布并开源 EVAC 世界模型与 EWMBench 评测基准,构建全链路技术闭环,解决具身智能测试和数据难题,组合方案入选官方赛道基线与标准。>阅读原文
DeepSeek新模型疑似泄露
消息称DeepSeek-V3-0526模型疑似泄露,性能媲美GPT - 4.5和Claude Opus,有望成最强开源模型。若消息属实,模型很快会发布,大家也在期待DeepSeek R2。>阅读原文
微软开源浏览器Agent超4000星
微软开源浏览器Agent Magentic-UI,基于Magentic - One。它采用人机协作模式,能提升任务完成率和准确率。有“行动保护”等机制,还能自我学习,在Github获超4000颗星。>阅读原文
开源微信机器人CoW爆火
开源君:chatgpt-on-wechat(CoW)超厉害,能无缝接入多平台,支持众多模型,可处理语音图片,有插件和会话记忆等功能,还能定制知识库,快去试试!>阅读原文
红杉中国推出Agent测试工具
红杉中国推出「xbench」:采用双轨评估体系,首期发布两个评估集并排名。它解决现有评估难题,兼顾模型理论能力与实际落地价值,还能预测技术 - 市场契合点,推动Agent应用发展。>阅读原文
RLFactory:Qwen3+MCP高效训Agent
GiantPandaCV:RLFactory解决现有RL框架痛点,支持端到端训练,奖励函数易设计、工具接入无门槛,用Qwen3和MCP工具训练DeepSearch模型,效率比传统方案提升1.5 - 2倍。>阅读原文
微软开源NLWeb助力AI Web
微软:开源NLWeb项目,利用现有网络生态简化网站对话式交互界面构建。它降低开发门槛、平台无关,能提升用户体验,促进AI代理交互,目标是构建“AI Web”。>阅读原文
红杉中国推出AI评测工具xbench
红杉中国:随着AI发展,现有评估方式难反映其客观能力。为此推出xbench,采用双轨评估与长青评估机制,首期发布两评估集,还将拓展多领域评估,邀各界共建新评估范式。>阅读原文
算法论文
西湖大学提出发散思维链
西湖大学齐国君教授团队:提出扩散式「发散思维链」,将反向扩散中间结果作推理过程,以最终结果正确性强化训练,提升大模型推理能力,在多任务上表现出色。>阅读原文
Agent蒸馏让小模型逆袭
论文指出大模型成本高,传统小模型学习有痛点。提出Agent蒸馏,让小模型用工具解题,加“外挂”提升学习效果,使小模型性能逼近甚至超越大模型,低成本Agent时代要来了。>阅读原文
Agent可自动设计并跨领域迁移
论文提出“元代理”可自动设计Agent。以代码为设计空间,突破传统局限。实战中AI设计的Agent全领域表现出色,还能跨领域迁移知识,未来或实现Agent自我进化,代码已开源。>阅读原文
北航:语言控制无人机飞行
北航刘偲教授团队:创新性提出语言引导的无人机轨迹控制框架,定义Flow范式,构建数据集与仿真基准,通过策略和算法实现真机部署,让无人机按自然语言指令飞行。>阅读原文
上海交大:扩散模型推理加速9倍
上海交大EPIC Lab团队:提出dLLM - Cache机制,复用特征降低计算量,可让扩散语言模型推理最高加速9.1倍,还能保持生成质量,通用于主流架构。>阅读原文
字节复旦推出自适应推理框架CAR
字节、复旦研究人员:提出自适应推理框架CAR,它能依据模型困惑度选短答或长推,在多测试中平衡效率与准确,打破长推性能更好的认知。>阅读原文
南京大学:Direct3D - S2解锁高效3D生成
南京大学:提出Direct3D - S2三维生成框架,用空间稀疏注意力机制加速计算,引入统一格式VAE,生成质量领先,还将高分辨率训练所需GPU数量大幅降低。>阅读原文
西工大提出多精度气动融合法
西工大宁晨伽、张伟伟等:围绕多源数据关联,提出基于共享并行架构的多精度气动融合方法,区分高低精度数据特征,通过算例验证其可提升模型精度与鲁棒性。>阅读原文
灵宝与中科院提出人机协作新方法
灵宝 CASBOT 与中科院自动化所:提出 DTRT 方法解决物理人机协作中意图估计和角色分配问题。实验显示其预测精度高、协作表现优,有望在多场景拓展。>阅读原文
</p>