All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-21 资讯日报
新闻资讯
谷歌I/O大会AI模型大升级
谷歌I/O大会搞事情,现有AI模型全更新,传统产品重做,还推新工具。Gemini 2.5系列升级霸榜,新模型Veo 3、Imagen 4亮相,搜索、会议等产品功能大增。>阅读原文
Anthropic创始人:AI将接管编程
Anthropic创始人Amodei称AI三到六个月或写90%代码,一年后或全写。谷歌部分代码已由AI生成。但人类短期内仍重要,程序员要转型与AI协作,不能抗拒变革。>阅读原文
谷歌I/O大会:AI产品大升级
谷歌桑达尔·皮查伊:2025 I/O大会发布众多更新,Gemini 2.5系列升级,搜索推AI模式,亮相Veo 3等模型,编码助手Jules公测,还规划Astra项目愿景,推Project Aura智能眼镜。>阅读原文
特斯拉转型AI遭遇困境
特斯拉业绩不佳,进入从汽车到AI的转型阵痛期。Cybertruck和Model 2/Q掉链子,汽车业务难以为AI输血,资本市场对其自动驾驶和AI承诺兑现度存疑,马斯克日子不好过。>阅读原文
谷歌I/O大会推超强AI全家桶
谷歌CEO桑达尔·皮查伊:谷歌正加速推进AI发展,新模型和功能不断推出,多项目融入产品。DeepMind负责人德米斯·哈萨比斯:Gemini 2.5 Pro是最强基础模型。谷歌此次大会带来诸多AI新动态。>阅读原文
Google I/O 2025:All In AI还开源模型
谷歌CEO:Google IO 2025亮点全是AI,Gemini 2.5系列等表现出色,Veo 3视频生成惊艳。还开源medgemma、gemma - 3n等模型,一年内token处理量增长50倍。>阅读原文
谷歌 I/O 大会 AI 成果大爆发
谷歌在 I/O 2025 大会火力全开,升级 Gemini 系列,推出编程智能体 Jules,展示视频图像生成新模型,搜索和购物模式也大升级,一改此前保守,强势回归 AI 应用浪潮。>阅读原文
谷歌云推毫秒级存储产品
谷歌云在大会推出 Rapid Storage,为数据访问提供毫秒级延迟,有低延迟、高吞吐量优势。社区将其与亚马逊 S3 Express 比较,目前尚处预览阶段。>阅读原文
微软Build2025开启AI智能体时代
微软:已迈入 AI 智能体时代,Build 2025 大会展示构建开放智能体网络路径。发布多平台新功能助力开发,让智能体更安全,支持 MCP 协议,还推平台加速科研。>阅读原文
谷歌大会:Gemini引领AI革新
谷歌I/O 2025大会王者归来,虽Gemini 2.5 Ultra未现身,但Pro等模型有革新。多模态能力爆发,搜索重塑,加入AI眼镜开发,全力发展AI生态,欲将Gemini扩展成“世界模型”。>阅读原文
谷歌大会:Agent智能体全面升级
谷歌‘I/O 2025’开发者大会大动作,Agent智能体升级。A2A协议更新功能多,生态壮大;发布管理界面、升级SDK;Project Mariner能力增强,还将拓展平台,提升用户体验。>阅读原文
MIT爆火AI论文被指数据造假
MIT博士生Aidan Toner - Rodgers论文称AI辅助科研,新材料发现量增44%等。曾轰动一时,获诺奖得主点赞,半年后因数据造假被责令撤稿,作者离开,论文暂未下架。>阅读原文
产品应用
Qwen3混合部署引爆MCP
作者:MCP是AI交互标准协议,解决传统问题。Qwen3性能强、成本低,有多种优势。采用Qwen3-0.6b和Qwen3-235b-a22b混合部署,多快好省,但存在资源消耗大等不足。>阅读原文
谷歌Jules编程智能体上线
谷歌:推出编程智能体Jules,免费试用,运行于Gemini 2.5 Pro模型,能深度融入开发工作。它与Codex各有优势,当下编程领域竞争激烈,AI辅助编程前景被看好。>阅读原文
OceanBase首推“共享存储”产品
OceanBase CTO:OceanBase推出“共享存储”产品,实现对象存储与TP深度集成,靠技术创新落地OLTP生产环境,降低存储成本,适用于多业务场景,未来或有更多厂商跟进。>阅读原文
极客时间助力企业数据人才培养
极客时间:当前企业数据人才培养存痛点,为此打造全链条体系。按管理者、业务人员、技术人员分层赋能,提供课程、工作坊等多种培养方式,助企业提升数据能力、降本增效。>阅读原文
Flowith Neo:通用Agent新王者
Flowith团队年轻,其Neo版通用Agent能力强。能写代码、做游戏、分析博主、发邮件、做报告。在GAIA测试中刷新SOTA评分,虽有生成不稳定等问题,未来仍值得关注。>阅读原文
刁娟创新蜀绣邂逅AI创作
刺绣有地域特色,蜀绣成非遗代表。国家级非遗蜀绣传承人刁娟创新作品,将传统与未来结合。2025年798节气海报用AI创作,展现非遗创意。>阅读原文
MCP SDK 新版推 streamable HTTP 模式
秋山墨客:MCP SDK 新版推 streamable HTTP 模式,介绍其使用、核心参数及 session - id 管理,实测展示不同模式效果,还提及开发服务端和多应用实例模式,新模灵活但有待完善。>阅读原文
推荐文章
Nick Bostrom谈AI与人类未来
Nick Bostrom:人工智能快速发展,我们应思考“已解决世界”的问题。在其中人类或面临意义危机,但也有快乐、体验质感等要素。我们要解决技术和政治挑战,让人工智能为人类所用。>阅读原文
黄益贺:别学提示词学逻辑
黄益贺:别学提示词、别买课,它是通用沟通技巧,靠逻辑和方法论。提示词上层要针对模型优化,普通用户做好底层就行,靠它收割流量无聊。>阅读原文
MCP客户端调用方法全解析
作者认为MCP解决了AI开发对接难题。介绍Spring - AI、Spring - AI - Alibaba框架及原生SDK调用MCP的方法,指出框架适合快速构建应用,原生SDK适合平台级开发。>阅读原文
Spring 之父弃 Java 转投 Kotlin
Spring 之父 Rod Johnson:开源需激发兴奋感;Kotlin 友好、易读、实用,代码完成质量高;Kotlin 与 Spring 结合近乎完美,但 JPA 契合度欠佳;期望 Kotlin 完善类型代数、简化对象字面量语法等。>阅读原文
开源动态
docext:免OCR提取文档信息
docext:无需OCR,可从文档图像提取结构化信息。利用VLMs,有灵活提取、表格提取等功能,支持本地化部署,还能通过REST API集成系统。>阅读原文
微软开源 NLWeb 实现智能搜索
微软在 Build 2025 大会开源 NLWeb,CEO 称其让用户用自然语言与网站交互。它比传统搜索便宜方便,能为网站打造智能语言体验,赋能网络发布者。>阅读原文
Windmill:低代码开发神器
开源君推荐开源项目Windmill,它可将脚本自动转换为工作流和UI,支持多脚本语言,性能高且安全。能快速构建内部工具,通过Docker等方式自托管,提升开发效率。>阅读原文
B站开源动漫视频生成新技术
B站:升级Index - AniSora技术并开源,提出二次元视频生成强化学习框架。构建奖励数据集,训练AnimeReward,用GAPO优化,实验显示能提升动漫视频生成质量,更贴合人类偏好。>阅读原文
Unsloth:从Adapter到全微调
魏新宇:大语言模型微调难,Unsloth 原支持 Adapter 微调,现支持全参数微调。它用梯度检查点等技术,还给出工程部署和使用建议,助开发者平衡内存与效率。>阅读原文
进击的Bruce:sglang分布式解析
进击的Bruce:以 deepseek 为例剖析 sglang 分布式和并行。介绍通信域类型,如 ZMQ 和 torch.dist 通信;阐述 TP、DP、EP 实现细节,包括初始化、使用;分析不同 Linear 层 TP 及 MoE 不同实现逻辑。>阅读原文
PandasAI:让数据分析如聊天简单
Sinaptik AI团队的PandasAI开源项目超厉害,有对话分析、图表生成等功能,技术架构强大,适用于市场分析等场景,安装使用简单,比同类工具更优。>阅读原文
智源BGE向量模型全面开放
智源研究院:联合高校研发三款BGE向量模型,包括代码、多模态及视觉化文档向量模型,登顶多领域测试基准,全面开放助力产业,未来将深耕提升模型能力。>阅读原文
微软开源 Copilot,价值在后端
微软在 Build 2025 大会开源 GitHub Copilot Extension for VS Code。Kai 称真正‘护城河’在服务端,客户端适合开源。Eric 眼红 Cursor,强调真正价值在后端,开源是为采用‘AI 优先’思维构建产品。>阅读原文
II-Agent:号称全球最强开源 Agent
Intelligent Internet 团队:打造号称‘全球最强’的开源 II-Agent,性能强悍、GAIA 跑分高,未来是 Agent 群的时代,要为多领域构建开源 Agent,号召共建智能未来。>阅读原文
微软开源Agent项目NLWeb
微软CEO:在Build大会宣布五件大事,4件与Agent有关,如升级GitHub Copilot等。开源NLWeb项目,用自然语言交互网站,有望成代理网络的HTML。>阅读原文
算法论文
LLM团队竟有“从众”毛病
浙江大学团队:大型语言模型组成的AI团队有“从众”错误,通过BenchForm测试平台验证。不同模型从众率不同,可通过设“学霸人设”、“自我复盘”减少从众,要平衡独立与协作。>阅读原文
上海AI实验室:TPO推理对齐偏好
上海人工智能实验室:TPO可让大模型推理时即时对齐偏好,无需训练。它类似文本梯度下降,在多任务评测中效果好,“宽深结合”策略能在资源受限下释放性能,拓展了LLM推理边界。>阅读原文
研究:CoT推理让LLM易「失智」
哈佛大学等研究发现,思维链CoT让大模型推理时忽视指令约束,准确率下降。如Meta - Llama - 3 - 8B启用CoT后准确率大跌。还提出四种缓解策略,提醒开发者明确使用边界。>阅读原文
EMMA 揭秘多模态模型短板
电子科技大学等团队推出 EMMA 基准测试,发现即使先进的多模态大模型在复杂多模态推理上落后人类超 20%。思维链提示、测试时计算扩展效果不佳,视觉推理是核心瓶颈,指明跨模态智能发展方向。>阅读原文
ParScale:大模型扩展新路线
研究团队:提出并行扩展ParScale路线,有新扩展定律,两阶段后训练策略降成本,在Qwen - 2.5上也能提升性能,适合边缘设备,后续会在更多模型和数据上尝试。>阅读原文
LaMMA - P破解多机器人任务分配难题
美国两校联合团队:发布LaMMA - P,将大模型与PDDL规划器融合,解决异构多机器人长时任务分配难题,实验中性能远超SMART - LLM,未来将拓展应用场景。>阅读原文
西工大团队推新型涡粘模型
西工大单湘淋、张伟伟等:针对非线性涡粘模型难题,用雷诺应力各向异性分析提取特征,构建新模型。在方形管道与矩形扩压器湍流测试中,新模型精度超现有QCR2000与QCR2024模型。>阅读原文
Google让RAG问答准确率提10%
Google:RAG系统幻觉或因上下文不足,构建评估器溯源错误。提出选择性生成框架,结合自评置信度与充分上下文信号,可让RAG问答准确率最高提升10%。>阅读原文
新评测框架助力AI迈向AGI
OpenAI姚顺雨:AI下半场重点从解题到定义问题,评估比训练重要。新加坡团队:提出“通才智能”评测框架,多数模型有偏科、生成弱、协同单向问题,王者段位空缺,评测革新将推动AGI落地。>阅读原文