AI Daily | AI日报：Founder Park启动AGI机构调研; 台积电：今年扩建9厂，2nm将量产; Switch 2芯片细节曝光引吐槽

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-05-16 资讯日报

新闻资讯

Founder Park启动AGI机构调研

Founder Park：鉴于AI发展影响产业与社会底层逻辑，现发起2025中国最具价值AGI创新机构TOP 50调研，面向中国企业，从多维度评选，6月21日公布结果。>阅读原文

台积电：今年扩建9厂，2nm将量产

台积电营运副总经理张宗生透露，今年扩建9座厂，3nm产能预计增60%。新竹20厂和高雄22厂将量产2nm，台中25厂2028年量产更先进技术。文章还盘点其现存26座厂区情况。>阅读原文

Switch 2芯片细节曝光引吐槽

数毛社曝光Switch 2芯片细节，采用英伟达定制版，配置提升，支持DLSS和光追。但也遭吐槽，像掌机性能降、续航或短等，不过相比Switch 1仍是进步。>阅读原文

新版Claude将具极限推理

The Information爆料：新版Claude将有“极限推理”功能，能像人一样思考处理问题，预计未来几周发布。虽有网友质疑，但也有实测证据，官方也在对更新版做压力测试，值得期待。>阅读原文

大佬揭秘ChatGPT记忆机制

OpenAI推ChatGPT聊天历史记忆功能，技术大佬破解其机制，含保存记忆、聊天记录等系统。体验反馈不一，虽能节省内存、理解需求，但也有无法保存、幻觉等诸多bug。>阅读原文

美拟给英伟达GPU装定位

美参议员Tom Cotton：提出法案，强制英伟达、AMD等高端GPU和AI芯片植入「地理追踪」功能，6个月后生效。这增加芯片厂负担，还为未来监管升级铺路。>阅读原文

郭春超：3D AIGC 革命未开始

腾讯混元 3D 负责人郭春超：真正的 3D AIGC 革命未开始，3D 生成尚处早期，面临从‘可见’到‘可用’、数据稀缺等挑战，开源能促发展，AI 是设计师生产力工具。>阅读原文

李飞飞：AI是文明级技术

李飞飞：AI是文明级技术，要以人为本。她回顾经历，强调好奇心，提出以人为本AI的同心圆层级，看好空间智能，认为AI应用广，还为技术人员和政策制定者给出发展建议。>阅读原文

个人开发者可训400亿参数模型

Nous Research：推出Psyche Network，基于Deepseek架构，用DisTrO优化器等技术实现40B参数LLM预训练，打破巨头算力垄断，让个人和小团体也能参与。>阅读原文

DeepMind AlphaEvolve突破数学极限

DeepMind发布AlphaEvolve，研究员称其能发现复杂算法。陶哲轩参与探索数学应用。它有减少幻觉机制，在数据中心调度、硬件设计等多方面提升效率，还改进矩阵乘法算法、解决开放性数学问题。>阅读原文

Poe报告：模型市场风云变幻

Poe报告：2025年1 - 5月，DeepSeek热度降，消息份额从7%降至3%；推理模型需求涨，消息份额从2%升至10%；图像、视频、音频领域竞争激烈，快手可灵成视频生成黑马。>阅读原文

大咖共探大模型业务价值转化

华为云郑岩、蚂蚁集团杨浩、明略科技吴昊宇探讨大模型业务应用：选场景看价值与成熟度；选模型考量推理、上下文等；AI Agent 有创新实践；MCP 应用有差异，还谈了未来智能体特质与团队能力建设。>阅读原文

产品应用

新手搭建AI模型开发环境

文章为AI模型开发新手提供环境搭建指南，包括安装显卡驱动、CUDA等工具，用Modelscope下载模型，还给出PyCharm配置方法，并对CPU与GPU、版本错误等常见问题提供解决方案。>阅读原文

Lovart Agent颠覆视觉设计

量子位：新晋Agent Lovart超火，能搞定专业视觉设计，支持二次编辑。实测设计能力强，靠多模型调度。定位人机协作，适合中小企业，官网可申内测。>阅读原文

GitHub Copilot 智能体模式上线

微软：GitHub Copilot 智能体模式上线 Visual Studio 预览版，可自主处理开发流程，功能强大。还引入 MCP 服务器，且更新将更频繁，开发者使用前可多方面考量。>阅读原文

Raycast + MCP打造AI Mac体验

黄益贺：Raycast添加AI插件可跨应用调度，支持MCP后解决其部署配置难题，提供自动和手动安装法，还分享常用支持MCP客户端，强调客户端需差异化。>阅读原文

MiniMax Speech - 02模型屠榜

MiniMax推出Speech - 02模型，登顶Arena榜单，在字错率、相似度等方面优于OpenAI、ElevenLabs。它超拟人、个性化、支持多语言，性价比高，创新架构解决行业痛点，应用前景广。>阅读原文

阿里云PolarDB登顶TPC - C

阿里云PolarDB云原生数据库登顶TPC - C，其MySQL版多主集群架构独特，通过PolarTrans等技术实现高性能横向跨机读写扩展，在性能、扩展性、高可用等方面表现出色，还有轻量版和列存索引应用。>阅读原文

Terminator：创新性AI工具

小G介绍Terminator机器人，它是AI优先计算机操作SDK，用类似Playwright的API与Windows原生GUI交互，速度快且能操作后台应用，重点支持Windows，部分支持macOS，暂不支持Linux。>阅读原文

YuLan-OneSim开启大社会实验

YuLan-OneSim：大语言模型驱动社会模拟，可零代码构建场景，有50个默认场景，分布式架构支持10万智能体，还推出AI社会研究员自动完成社科研究。>阅读原文

MiniMax语音模型全球夺冠

MiniMax发布Speech - 02，超OpenAI成全球语音测评第一。它兼顾超拟人、个性与多样，技术创新，在教育、汽车等多行业落地，全模态布局领先，为行业树立榜样。>阅读原文

谷歌 AlphaEvolve 破数学纪录

谷歌 DeepMind 推出 AlphaEvolve，破多项数学记录，如 4x4 矩阵乘法 48 步计算。它已用于谷歌数据中心等，提升效率，还将探索多领域，强调人机协作。>阅读原文

MiniMax语音模型登顶国际榜

歸藏的AI工具箱：MiniMax的Speech-02语音模型登顶国际榜单，引入新编码器有诸多创新，测试中音色丰富、读音准、多语种表现佳，声音复刻能骗过同事，期待自定义音色功能全量上线。>阅读原文

腾讯CodeBuddy打通微信小程序

数字生命卡兹克：腾讯云CodeBuddy 3.0是插件式代码助手，与微信开发打通，借助微信知识库可快速开发小程序，让普通人想法变作品，是新创造与分发渠道。>阅读原文

Dia 浏览器内测后将正式发布

池建强：Dia 浏览器内测反馈好，将打磨后发布。它用 AI 时能代入上下文，Chat 交互体验优。CEO 称 Arc 部分功能会融入 Dia，还对新互联网时代很兴奋。>阅读原文

Google 发布编码智能体 AlphaEvolve

DeepMind 发布 AlphaEvolve 编码智能体，结合 LLM 与评估机制减少幻觉。它能优化谷歌计算生态，如提升数据中心调度、硬件设计等效率，还在数学算法上取得突破，改进矩阵乘法算法等。>阅读原文

开源动态

VITA - Audio：53ms语音生成新秀

VITA团队：开源端到端语音模型VITA - Audio，7B参数模型首次生成音频仅53ms，比同级别快3 - 5倍，有超低延迟等优势，代码、数据、权重全公开，助力开发者。>阅读原文

StarRocks MCP Server 开源

StarRocks：MCP Server 开源，为 AI 应用提供强大分析中枢。它让 LLM 可标准化访问 StarRocks，执行 SQL 查询。具备工具、资源、提示词等能力，应用场景丰富，能降低成本、增强决策智能。>阅读原文

Gocron：替代Crontab的开源神器

小华：Gocron基于Go语言开发，能替代Linux Crontab。它功能强大，有可视化界面、秒级调度等特性，适用于多场景，部署简单，比同类项目优势明显，重新定义定时任务管理。>阅读原文

谢赛宁团队推出Blip3 - o模型

谢赛宁团队：推出统一多模态模型Blip3 - o，提出新方法生成CLIP图像特征，确定CLIP + Flow Matching为最佳设计，采用顺序训练策略，模型性能卓越且全开源。>阅读原文

Kyanos：网络分析开源神器

Kyanos：基于eBPF的开源网络分析工具，零配置、透视内核、解密流量。功能多，适用于事故应急、微服务调优等，比tcpdump、Wireshark等有显著优势。>阅读原文

提示词注入攻击检测与防护

孙志敏：提示词注入攻击危害大，被OWASP列为2025年大模型应用风险首位。Meta发布测试数据集，有多个工具和数据集可评估。防护用AI防火墙，Meta开源小模型，要权衡安全性与实用性。>阅读原文

SGLang优化DeepSeek V3/R1推理

BBuf：SGLang是单机H200上推理DeepSeek V3/R1较快的开源框架。文中盘点其大量工程优化技巧，如FP8 Block GEMM演进、FusedMoE模块优化等，使推理吞吐较年初提升几倍。>阅读原文

千问3：开源模型王者崛起

作者：英伟达新开源模型选千问作底座。千问3生态繁荣，衍生模型多、下载量高，获主流框架和硬件厂商支持。性能比肩顶级闭源模型，正加速开启全栈式AI时代。>阅读原文

Hugging Face开源MCP课程

Hugging Face：推出免费开源MCP课程，从理论到实践一应俱全。无MCP开发复杂，MCP可将其转化为简单问题，通过标准接口降低集成与维护成本。>阅读原文

算法论文

LongCodeBench测长文本模型能力

论文用LongCodeBench测评顶尖模型，发现Claude 3.5等在长文本任务表现差，开源模型几乎‘全军覆没’。长上下文面临注意力分散等问题，开发者别轻信宣传，开源模型待突破。>阅读原文

快手清华：DiffMoE提升扩散模型性能

快手&清华团队：推出DiffMoE，引入批级全局token池和动态容量预测器，提升模型学习与资源分配能力，在多测试中性能超现有模型，未来集成新技术或有新突破。>阅读原文

WebThinker 赋予 LRM 深度研究能力

李晓熙团队：大型推理模型遇复杂任务受限，WebThinker 应运而生。它让 LRM 自主搜索、写作，实验表现佳，未来可朝多模态搜索、工具扩展、GUI 探索等方向发展。>阅读原文

DeepSeek V3：大模型训练推理新突破

DeepSeek：发布开源模型V3论文，用DeepSeek - MoE、多头潜在注意力等技术，解决大模型内存、计算效率等问题，还提出硬件设计建议及优化网络方案，提升训练和推理性能。>阅读原文

DeepSeek-V3 论文揭低成本训练秘密

DeepSeek 发布 DeepSeek-V3 技术论文，CEO 梁文锋署名。论文从双重视角探讨训练和推理，模型有 DeepSeekMoE、MLA 等创新设计，还为未来硬件架构设计提方向，助力低成本高效训练。>阅读原文

DeepMind提出CaMeL防提示词注入

谷歌DeepMind：提出CaMeL抵御LLM提示词注入，在AgentDojo中能抵御67%攻击。它采用传统安全原则，不依赖更多AI，但依赖用户定义策略，可能致用户疲劳。>阅读原文

字节AttentionInfluence提升模型推理

字节Seed团队：AttentionInfluence方法无需训练标签，用1.3B模型为7B模型选数据。通过比较损失差异评估，在多基准测试提升性能，还能与分类器结合全面提升大模型表现。>阅读原文

多模态大模型评测新范式发布

General-Level团队：提出General-Level评测框架和General-Bench数据集，构建排行榜。五级段位体系考察模型协同效应，目前多数模型在Level-2，Level-5空缺，该项目推动多模态通才AI研究。>阅读原文

清华团队：LLM数据筛选新突破

清华刘知远团队：提出LLM数据筛选新方案，‘半成品加工法’降成本90%，用fastText筛数据，产出Ultra - FineWeb数据集，提升模型性能，还将拓展到专业领域。>阅读原文

DeepSeek V3公开降本秘诀

DeepSeek团队：发布论文公开DeepSeek - V3降成本秘诀。通过软硬协同设计，采用新架构、低精度训练等方法，解决内存、成本和速度问题，还对未来硬件架构提出建议，缓解内存瓶颈。>阅读原文

港科大vivo：数据筛选效率提10倍

港科大和vivo AI Lab：提出PreSelect数据筛选法，用fastText评分器减少计算需求。它更客观轻量，在多数据集实验中效果显著，能提升模型各领域表现，减少样本长度偏差。>阅读原文

DeepSeek V3曝软硬协同秘诀

DeepSeek新论文揭示V3/R1开发奥秘，展示硬件与大模型架构协同设计可突破瓶颈，实现低成本高效训练推理。还介绍关键创新，为未来AI硬件与模型协同设计给出方向。>阅读原文