All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-08 资讯日报
新闻资讯
AI第二章:应用与Agent崛起
业界认为AI进入产品创新阶段,投资转向应用。DeepSeek推动模型发展,Manus展现应用潜力。Agent发展有通用与垂直之争,各领域如硬件、编码、内容平台等均有新趋势,创业者和投资人需适应变化。>阅读原文
Mistral Medium 3高性价比登场
Mistral AI发布Mistral Medium 3,成本低性能好,API已上线多个平台。该模型有企业级能力,还推出企业聊天服务。网友看法不一,StabilityAI创始人指出其竞争Gemini 2.5 Flash有难度。>阅读原文
AI玩具创业热潮遇冷
AI玩具创业热潮下,大厂创业者携资入局却成果不佳。产品多是‘语音盒子’,技术依赖第三方,成本降低。从业者认为靠大模型创业优势不再,开辟‘情感科技’赛道或有未来。>阅读原文
OpenAI启动多国AI合作计划
OpenAI:宣布OpenAI for Countries计划,要为各国建类似“星际之门”项目,合作开发AI基建,提供定制版ChatGPT,首阶段开展10个项目,巩固美AI领导地位。>阅读原文
Mistral 3实测与宣传不符
Mistral AI:Mistral Medium 3性能接近Claude Sonnet 3.7且成本低。网友实测结果不一,大佬‘karminski - 牙医’:性能没官方吹得强,别下载浪费空间。>阅读原文
特朗普拟取消AI芯片出口限制
彭博消息:特朗普拟撤销AI芯片出口限制。此前限制遭反对,美商务部称旧规阻碍创新。英伟达因限制有损失,其CEO黄仁勋看好中国市场,错过将是巨大损失。>阅读原文
微软支持A2A、MCP,智能体时代降临
微软宣布两大开发平台支持A2A协议,还将与谷歌合作扩大。此前已支持MCP,两协议可打破智能体壁垒。微软CEO高度评价,网友认为智能体网络进入实战阶段。>阅读原文
Gemini 2.5 Pro编程屠榜
谷歌:新升级的Gemini 2.5 Pro(I/O版)登顶LMAreana,编程碾压Claude 3.7。开发者可通过相关平台使用,其在多方面表现出色,演示获众多开发者称赞。>阅读原文
AI开发工具:VSCode之争打响
AI开发工具领域,VSCode限制多,开发者面临战略抉择。OpenVSX是替代方案但有缺陷,Cursor崛起,微软出手让部分插件在其IDE失效,大家盼良性竞争、开放规则。>阅读原文
产品应用
通义灵码编程智能体上线
阿里 Qwen3 开源且性能佳,通义灵码支持其并上线编程智能体。该智能体能力多,支持 MCP 工具,集成魔搭广场,可将复杂开发工作化繁为简,大幅提升研发效率。>阅读原文
Google新版Gemini模型卷飞了
Google更新Gemini 2.5 Pro到05 - 06版,代码能力在盲测竞技场超Claude 3.7 Sonnet夺冠,还提升视频理解,能把视频转网页,虽产品有瑕疵,但模型进步显著。>阅读原文
7家企业借AI解锁商业格局
OpenAI报告揭秘7家先锋企业AI应用经验。摩根士丹利评估后让财务顾问用AI提效;Indeed用GPT优化职位匹配;Klarna的AI客服助手降时提效,多企业借AI解锁商业新格局。>阅读原文
Gamma:AI PPT赛道突围者
华人团队创办的Gamma,靠卡片式编辑等特色功能、PLG模式,在AI PPT赛道突围,打败Tome。它从AI PPT升级为创意创作平台,未来挑战主要来自自身。>阅读原文
Windsurf新功能或打击编排工具
ully:Windsurf推出workflow功能,采用自然语言定义工作流,相比传统编排工具优势明显,或对Dify等造成‘降维打击’,平台工具开发者需思考应对之策。>阅读原文
Cursor:“护城河”与挑战并存
文章指出,Cursor有产品粘性、集成度高和先发优势等“护城河”,但大模型“商品化”和众多对手是挑战。它可通过平台化等巩固优势,最终能否胜出需长期观察。>阅读原文
Fellou:Agentic Browser新尝试
作者体验Fellou后指出,它与Manus路线不同,前者做基于浏览器新系统。Fellou有跨平台搜索等功能,但上手难、执行慢。Agentic Browser发展尚早,官方预告后续能力,值得期待。>阅读原文
推荐文章
朱哲清:RL 是超人类智能关键
Pokee.ai 朱哲清:单靠预测难完成复杂任务,强化学习是超人类智能关键。其产品 Pokee.ai 执行力强,可完成复杂任务。他认为通用 Agent 或呈分层结构,未来浏览器可能被取代。>阅读原文
Hugging Face:LaTeX解析排障指南
Hugging Face文章指出,大模型评估中LaTeX公式解析难,无标准方法。lm - evaluation框架用sympy解析准确率约0.94,添加字符串比较检查可缓解问题。>阅读原文
2025 大厂面试真题大揭秘
小华:整理 2025 年字节、腾讯、阿里面试真题,如字节考哈希算法生成短链,腾讯问 Rocket 集群方案,阿里涉及 mq 解耦等,还配分析、答案和记忆法。>阅读原文
CourseAI解读Agent记忆系统
CourseAI:LLM进入Agent时代,记忆模块研究成重点。以往研究有不足,作者提出全面研究框架,对记忆分类,引入六种操作,还介绍了长期上下文、参数记忆修改等方面的方法。>阅读原文
开源动态
UniME框架登顶MMEB训练榜
格灵深瞳等团队:联合发布的UniME多模态框架很牛,经两阶段训练,在多模态检索、跨模态检索等任务上性能显著提升,超越多个基线模型,还开源了项目。>阅读原文
腾讯开源FlexiAct动作迁移模型
清华和腾讯:推出FlexiAct动作迁移模型,引入RefAdapter和FAE,解决现有方法适应性差问题,在不同场景精准适配动作,保持外观一致,表现远超其他方法。>阅读原文
GOSIM AI Paris 2025圆满收官
GOSIM AI Paris 2025大会上,专家指出大模型多趋势,如多模态统一架构等;强调开源和开放标准推动AI发展,还宣布新型许可证;各分论坛展示模型、基础设施等成果,下一站杭州9月见。>阅读原文
GOSIM大会:开源AI引领变革
GOSIM联合创始人Michael Yuan:开源AI已追上闭源,AGI或由多模型组成网络;OpenWallet基金会Daniel Goldscheider:《全球数字契约》促多方数字合作;大会多专家分享开源AI各领域进展。>阅读原文
智源研究院发布CCI 4.0数据集
智源研究院:2025年5月6日发布CCI 4.0数据集并多平台开源。其规模大、处理严,此前CCI系列已助力大模型研发,未来将持续建设中文预训练语料库。>阅读原文
浙大哈佛ICEdit图像编辑模型逆袭
浙大和哈佛团队:提出图像编辑方法ICEdit,用0.1%训练数据和1%参数量实现高质量编辑。通过免训练架构、LoRA微调、推理时拓展策略提升性能,泛化性强。>阅读原文
Voila:超低延迟引领语音对话
Maitrix团队:新开源Voila语音模型优势显著,195ms超低延迟实现全双工对话,支持多语言,功能丰富,适用于虚拟人、语音助手等场景,构建AI语音应用可重点关注。>阅读原文
算法论文
Absolute Zero:零数据大模型推理范式
清华大学等团队提出 Absolute Zero 推理范式,摆脱人类数据依赖。基于此的 AZR 模型在多基准任务超越主流模型,展现零数据自我进化潜力,不过其安全性与稳定性待研究。>阅读原文
RM - R1:小模型超越GPT - 4
论文团队受人类评分启发,提出ReasRM奖励模型。经两阶段训练,能分任务打分、动态奖励。实验显示它超越GPT - 4,小模型逆袭大,团队已开源6个模型。>阅读原文
ICML 2025:极大值解锁LLM上下文理解
罗格斯大学团队研究指出,自注意力模块Q和K中的极大值对LLM上下文理解至关重要。该现象与RoPE相关,破坏极大值会使上下文任务性能骤降,研究为模型设计等提供新思路。>阅读原文
LLM推理引擎优化与展望
编辑部:LLM计算成本高,为平衡低延迟和高吞吐,工程师开发多种优化技术。论文对比25款推理引擎,未来推理引擎在多模态、手机端、新型架构支持上有进化空间。>阅读原文
社交Agent思维切换超GPT - 4
论文指出大模型思维单一,研究团队受分层认知控制理论启发,设计4种思维模式,用AMPO算法动态切换。在模拟社交任务中,AMPO任务成功率高、效率提升,思维模式分布灵活。>阅读原文
未分类
1. Anthropic首启股票回购
Anthropic首次启动员工股票回购计划,估值615亿美元。此次面向特定员工,月底完成。其回购方式独特,既能限制新投资者,又能简化流程,是吸引和留住人才的关键举措。>阅读原文