All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-16 资讯日报
新闻资讯
Founder Park启动AGI机构调研
Founder Park:鉴于AI发展影响产业与社会底层逻辑,现发起2025中国最具价值AGI创新机构TOP 50调研,面向中国企业,从多维度评选,6月21日公布结果。>阅读原文
台积电:今年扩建9厂,2nm将量产
台积电营运副总经理张宗生透露,今年扩建9座厂,3nm产能预计增60%。新竹20厂和高雄22厂将量产2nm,台中25厂2028年量产更先进技术。文章还盘点其现存26座厂区情况。>阅读原文
Switch 2芯片细节曝光引吐槽
数毛社曝光Switch 2芯片细节,采用英伟达定制版,配置提升,支持DLSS和光追。但也遭吐槽,像掌机性能降、续航或短等,不过相比Switch 1仍是进步。>阅读原文
新版Claude将具极限推理
The Information爆料:新版Claude将有“极限推理”功能,能像人一样思考处理问题,预计未来几周发布。虽有网友质疑,但也有实测证据,官方也在对更新版做压力测试,值得期待。>阅读原文
大佬揭秘ChatGPT记忆机制
OpenAI推ChatGPT聊天历史记忆功能,技术大佬破解其机制,含保存记忆、聊天记录等系统。体验反馈不一,虽能节省内存、理解需求,但也有无法保存、幻觉等诸多bug。>阅读原文
美拟给英伟达GPU装定位
美参议员Tom Cotton:提出法案,强制英伟达、AMD等高端GPU和AI芯片植入「地理追踪」功能,6个月后生效。这增加芯片厂负担,还为未来监管升级铺路。>阅读原文
郭春超:3D AIGC 革命未开始
腾讯混元 3D 负责人郭春超:真正的 3D AIGC 革命未开始,3D 生成尚处早期,面临从‘可见’到‘可用’、数据稀缺等挑战,开源能促发展,AI 是设计师生产力工具。>阅读原文
李飞飞:AI是文明级技术
李飞飞:AI是文明级技术,要以人为本。她回顾经历,强调好奇心,提出以人为本AI的同心圆层级,看好空间智能,认为AI应用广,还为技术人员和政策制定者给出发展建议。>阅读原文
个人开发者可训400亿参数模型
Nous Research:推出Psyche Network,基于Deepseek架构,用DisTrO优化器等技术实现40B参数LLM预训练,打破巨头算力垄断,让个人和小团体也能参与。>阅读原文
DeepMind AlphaEvolve突破数学极限
DeepMind发布AlphaEvolve,研究员称其能发现复杂算法。陶哲轩参与探索数学应用。它有减少幻觉机制,在数据中心调度、硬件设计等多方面提升效率,还改进矩阵乘法算法、解决开放性数学问题。>阅读原文
Poe报告:模型市场风云变幻
Poe报告:2025年1 - 5月,DeepSeek热度降,消息份额从7%降至3%;推理模型需求涨,消息份额从2%升至10%;图像、视频、音频领域竞争激烈,快手可灵成视频生成黑马。>阅读原文
大咖共探大模型业务价值转化
华为云郑岩、蚂蚁集团杨浩、明略科技吴昊宇探讨大模型业务应用:选场景看价值与成熟度;选模型考量推理、上下文等;AI Agent 有创新实践;MCP 应用有差异,还谈了未来智能体特质与团队能力建设。>阅读原文
产品应用
新手搭建AI模型开发环境
文章为AI模型开发新手提供环境搭建指南,包括安装显卡驱动、CUDA等工具,用Modelscope下载模型,还给出PyCharm配置方法,并对CPU与GPU、版本错误等常见问题提供解决方案。>阅读原文
Lovart Agent颠覆视觉设计
量子位:新晋Agent Lovart超火,能搞定专业视觉设计,支持二次编辑。实测设计能力强,靠多模型调度。定位人机协作,适合中小企业,官网可申内测。>阅读原文
GitHub Copilot 智能体模式上线
微软:GitHub Copilot 智能体模式上线 Visual Studio 预览版,可自主处理开发流程,功能强大。还引入 MCP 服务器,且更新将更频繁,开发者使用前可多方面考量。>阅读原文
Raycast + MCP打造AI Mac体验
黄益贺:Raycast添加AI插件可跨应用调度,支持MCP后解决其部署配置难题,提供自动和手动安装法,还分享常用支持MCP客户端,强调客户端需差异化。>阅读原文
MiniMax Speech - 02模型屠榜
MiniMax推出Speech - 02模型,登顶Arena榜单,在字错率、相似度等方面优于OpenAI、ElevenLabs。它超拟人、个性化、支持多语言,性价比高,创新架构解决行业痛点,应用前景广。>阅读原文
阿里云PolarDB登顶TPC - C
阿里云PolarDB云原生数据库登顶TPC - C,其MySQL版多主集群架构独特,通过PolarTrans等技术实现高性能横向跨机读写扩展,在性能、扩展性、高可用等方面表现出色,还有轻量版和列存索引应用。>阅读原文
Terminator:创新性AI工具
小G介绍Terminator机器人,它是AI优先计算机操作SDK,用类似Playwright的API与Windows原生GUI交互,速度快且能操作后台应用,重点支持Windows,部分支持macOS,暂不支持Linux。>阅读原文
YuLan-OneSim开启大社会实验
YuLan-OneSim:大语言模型驱动社会模拟,可零代码构建场景,有50个默认场景,分布式架构支持10万智能体,还推出AI社会研究员自动完成社科研究。>阅读原文
MiniMax语音模型全球夺冠
MiniMax发布Speech - 02,超OpenAI成全球语音测评第一。它兼顾超拟人、个性与多样,技术创新,在教育、汽车等多行业落地,全模态布局领先,为行业树立榜样。>阅读原文
谷歌 AlphaEvolve 破数学纪录
谷歌 DeepMind 推出 AlphaEvolve,破多项数学记录,如 4x4 矩阵乘法 48 步计算。它已用于谷歌数据中心等,提升效率,还将探索多领域,强调人机协作。>阅读原文
MiniMax语音模型登顶国际榜
歸藏的AI工具箱:MiniMax的Speech-02语音模型登顶国际榜单,引入新编码器有诸多创新,测试中音色丰富、读音准、多语种表现佳,声音复刻能骗过同事,期待自定义音色功能全量上线。>阅读原文
腾讯CodeBuddy打通微信小程序
数字生命卡兹克:腾讯云CodeBuddy 3.0是插件式代码助手,与微信开发打通,借助微信知识库可快速开发小程序,让普通人想法变作品,是新创造与分发渠道。>阅读原文
Dia 浏览器内测后将正式发布
池建强:Dia 浏览器内测反馈好,将打磨后发布。它用 AI 时能代入上下文,Chat 交互体验优。CEO 称 Arc 部分功能会融入 Dia,还对新互联网时代很兴奋。>阅读原文
Google 发布编码智能体 AlphaEvolve
DeepMind 发布 AlphaEvolve 编码智能体,结合 LLM 与评估机制减少幻觉。它能优化谷歌计算生态,如提升数据中心调度、硬件设计等效率,还在数学算法上取得突破,改进矩阵乘法算法等。>阅读原文
推荐文章
三星先进封装技术解读
作者指出集成电路制造与封测融合,解读三星先进封装技术,分I - Cube和X - Cube两类。三星在该领域多为跟随者,产品知名度和影响力低,要赶超台积电和英特尔需发力。>阅读原文
Simon V:CUDA程序向量化提效
Simon V:分析SASS代码可提高内存受限CUDA程序性能。以向量复制程序为例,向量化版本用LDG.E.128/STG.E.128加载/存储128位数据,启动块数少,性能更快。>阅读原文
一文读懂Embedding演变
文章指出Embedding是LLM语义支柱,介绍其从传统到现代的演变。像TF - IDF简单但缺乏语义联系,word2vec能捕捉语义,BERT是语境化动态嵌入代表,还分析DS - Qwen1.5B的Embedding。>阅读原文
编辑部推LLM/AI必读系列
编辑部推荐快速进阶LLM/AI必读系列,含Tokenization、Vectorization等多领域资料,给出众多论文链接,像BERT、Google Titans等,助读者掌握前沿知识。>阅读原文
许华哲:具身智能发展之思
清华许华哲认为具身智能爆发因人类无法完全数字化。指出其几种失败模式,如聚焦特殊任务等。还探讨输入信号、触觉应用等问题,强调强化学习重要但应用待探索,‘ImageNet时刻’是伪命题。>阅读原文
诺基亚兴衰,中美科技竞争启示
诺基亚曾从橡胶厂成科技霸主,后被苹果等超越。其崛起靠市场、人才等共振,失败因利益分配失衡致盟友背离。此为中美科技竞争提供启示,重塑利益格局是关键武器。>阅读原文
残差连接:破解大模型训练难题
文章指出,大型语言模型多层结构易出现网络退化和梯度传导困难问题。残差连接让信息直接从输入到输出,确保信息完整准确,使梯度反向传播更稳定,是大模型能达上百层的关键。>阅读原文
MCP开发:6个高效小妙招
作者分享MCP开发经验:配置支持MCP的客户端和LLM API,阿里云可观测2.0融合MCP可优化系统观测。设计MCP Server要注意接口精简、参数默认等,MCP适合短平快场景,复杂需求需A2A等模式。>阅读原文
AGIX:AI投资高弹性之选
拾象认为,尽管市场调整,AGIX 仍有高弹性,过去一月涨幅超 20%。它覆盖高成长、合理估值的 AI 股。1Q2025 财报季,AI 落地应用成效显著,多公司借 AI 实现业务增长。>阅读原文
烧94亿Token,成本降43%引争议
作者:用选模型、提示词缓存等策略,将OpenAI成本降43%。网友:早看文档或设计时考虑能省Token,还质疑为何不用其他便宜模型,也指出部分建议非通用。>阅读原文
挚文集团:大模型狙击社交黑产
挚文集团李波:社交生态治理面临多元多模态、强对抗等难题。多模态大模型经三方案迭代效果提升;细粒度用户画像用统一方案;审核侧有同步、异步方案,还升级黑库,未来将强化能力、全链路应用。>阅读原文
开源动态
VITA - Audio:53ms语音生成新秀
VITA团队:开源端到端语音模型VITA - Audio,7B参数模型首次生成音频仅53ms,比同级别快3 - 5倍,有超低延迟等优势,代码、数据、权重全公开,助力开发者。>阅读原文
StarRocks MCP Server 开源
StarRocks:MCP Server 开源,为 AI 应用提供强大分析中枢。它让 LLM 可标准化访问 StarRocks,执行 SQL 查询。具备工具、资源、提示词等能力,应用场景丰富,能降低成本、增强决策智能。>阅读原文
Gocron:替代Crontab的开源神器
小华:Gocron基于Go语言开发,能替代Linux Crontab。它功能强大,有可视化界面、秒级调度等特性,适用于多场景,部署简单,比同类项目优势明显,重新定义定时任务管理。>阅读原文
谢赛宁团队推出Blip3 - o模型
谢赛宁团队:推出统一多模态模型Blip3 - o,提出新方法生成CLIP图像特征,确定CLIP + Flow Matching为最佳设计,采用顺序训练策略,模型性能卓越且全开源。>阅读原文
Kyanos:网络分析开源神器
Kyanos:基于eBPF的开源网络分析工具,零配置、透视内核、解密流量。功能多,适用于事故应急、微服务调优等,比tcpdump、Wireshark等有显著优势。>阅读原文
提示词注入攻击检测与防护
孙志敏:提示词注入攻击危害大,被OWASP列为2025年大模型应用风险首位。Meta发布测试数据集,有多个工具和数据集可评估。防护用AI防火墙,Meta开源小模型,要权衡安全性与实用性。>阅读原文
SGLang优化DeepSeek V3/R1推理
BBuf:SGLang是单机H200上推理DeepSeek V3/R1较快的开源框架。文中盘点其大量工程优化技巧,如FP8 Block GEMM演进、FusedMoE模块优化等,使推理吞吐较年初提升几倍。>阅读原文
千问3:开源模型王者崛起
作者:英伟达新开源模型选千问作底座。千问3生态繁荣,衍生模型多、下载量高,获主流框架和硬件厂商支持。性能比肩顶级闭源模型,正加速开启全栈式AI时代。>阅读原文
Hugging Face开源MCP课程
Hugging Face:推出免费开源MCP课程,从理论到实践一应俱全。无MCP开发复杂,MCP可将其转化为简单问题,通过标准接口降低集成与维护成本。>阅读原文
算法论文
LongCodeBench测长文本模型能力
论文用LongCodeBench测评顶尖模型,发现Claude 3.5等在长文本任务表现差,开源模型几乎‘全军覆没’。长上下文面临注意力分散等问题,开发者别轻信宣传,开源模型待突破。>阅读原文
快手清华:DiffMoE提升扩散模型性能
快手&清华团队:推出DiffMoE,引入批级全局token池和动态容量预测器,提升模型学习与资源分配能力,在多测试中性能超现有模型,未来集成新技术或有新突破。>阅读原文
WebThinker 赋予 LRM 深度研究能力
李晓熙团队:大型推理模型遇复杂任务受限,WebThinker 应运而生。它让 LRM 自主搜索、写作,实验表现佳,未来可朝多模态搜索、工具扩展、GUI 探索等方向发展。>阅读原文
DeepSeek V3:大模型训练推理新突破
DeepSeek:发布开源模型V3论文,用DeepSeek - MoE、多头潜在注意力等技术,解决大模型内存、计算效率等问题,还提出硬件设计建议及优化网络方案,提升训练和推理性能。>阅读原文
DeepSeek-V3 论文揭低成本训练秘密
DeepSeek 发布 DeepSeek-V3 技术论文,CEO 梁文锋署名。论文从双重视角探讨训练和推理,模型有 DeepSeekMoE、MLA 等创新设计,还为未来硬件架构设计提方向,助力低成本高效训练。>阅读原文
DeepMind提出CaMeL防提示词注入
谷歌DeepMind:提出CaMeL抵御LLM提示词注入,在AgentDojo中能抵御67%攻击。它采用传统安全原则,不依赖更多AI,但依赖用户定义策略,可能致用户疲劳。>阅读原文
字节AttentionInfluence提升模型推理
字节Seed团队:AttentionInfluence方法无需训练标签,用1.3B模型为7B模型选数据。通过比较损失差异评估,在多基准测试提升性能,还能与分类器结合全面提升大模型表现。>阅读原文
多模态大模型评测新范式发布
General-Level团队:提出General-Level评测框架和General-Bench数据集,构建排行榜。五级段位体系考察模型协同效应,目前多数模型在Level-2,Level-5空缺,该项目推动多模态通才AI研究。>阅读原文
清华团队:LLM数据筛选新突破
清华刘知远团队:提出LLM数据筛选新方案,‘半成品加工法’降成本90%,用fastText筛数据,产出Ultra - FineWeb数据集,提升模型性能,还将拓展到专业领域。>阅读原文
DeepSeek V3公开降本秘诀
DeepSeek团队:发布论文公开DeepSeek - V3降成本秘诀。通过软硬协同设计,采用新架构、低精度训练等方法,解决内存、成本和速度问题,还对未来硬件架构提出建议,缓解内存瓶颈。>阅读原文
港科大vivo:数据筛选效率提10倍
港科大和vivo AI Lab:提出PreSelect数据筛选法,用fastText评分器减少计算需求。它更客观轻量,在多数据集实验中效果显著,能提升模型各领域表现,减少样本长度偏差。>阅读原文
DeepSeek V3曝软硬协同秘诀
DeepSeek新论文揭示V3/R1开发奥秘,展示硬件与大模型架构协同设计可突破瓶颈,实现低成本高效训练推理。还介绍关键创新,为未来AI硬件与模型协同设计给出方向。>阅读原文