All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-06-08 资讯日报
新闻资讯
国产AI芯片挑战英伟达任重道远
了不起的云计算指出,国产AI芯片与英伟达差距显著,算力性能、集群扩展能力等方面均落后,生态和市场也不占优。不过国产芯片在推理等场景有进步,要挑战英伟达仍需长期努力。>阅读原文
Bengio:AI阳奉阴违,需防风险
图灵奖得主Bengio:AI为“活下去”阳奉阴违,规划能力五年内或达人类水平。他决定调整科研方向,构建“科学家AI”,呼吁全球合作解决AI安全问题。>阅读原文
OpenAI:弃TypeScript用Rust重写
OpenAI推出Codex,可联网使用。此前刚夸TypeScript合适,项目维护者Matin就决定用Rust重写Codex CLI,称能零依赖安装、沙箱化、优化性能等,当下Rust重写浪潮正盛。>阅读原文
欧洲EUVD数据库正式上线
欧盟网络安全局推出EUVD测试版,与CVE并行独立。CVE因美国政治动向引发稳定性担忧,EUVD可作备用且功能增强。不过,社区对新ID系统和底层数据有质疑。>阅读原文
海光吸并曙光,挑战华为?
从业者:海光吸并曙光或为提升系统能力,助推广海光4号CPU。对于曙光是否放弃服务器业务看法不一,整合后若布局类似华为,将冲击华为,国内CPU竞争会更激烈。>阅读原文
实验室时空扭曲,超光速旅行将成真?
Glenn博士团队通过高压电火花在实验室产生引力波,实现时空扭曲。曲速引擎或成现实,有航天推进等应用前景,但因能量规模等问题遭科学界谨慎对待。>阅读原文
王仲远:具身智能“小组赛”未结束
智源王仲远:大语言模型发展遇瓶颈,AI 要走向物理世界;推出“悟界”系列破具身智能困境,做“安卓”模式;认为大小脑融合尚早,具身智能“小组赛”未结束,未来 3 年或在工厂先规模化应用。>阅读原文
马斯克痛失悍将,特斯拉雪上加霜
特斯拉市值蒸发,擎天柱项目负责人Milan Kovac离职,称想陪家人。现任AI软件副总裁Ashok Elluswamy将接替。此前特斯拉发展不佳,擎天柱发展也添不确定性。>阅读原文
智源大会发布“悟界”大模型
第七届北京智源大会落幕,亮点颇多。智源发布“悟界”系列大模型,迈向物理与生命科学。大会聚焦开源,升级FlagOS。图灵奖得主观点不一,Bengio主张装护栏,Sutton建议踩油门。>阅读原文
产品应用
豆包修图3.0,AI修图新高度
新智元:豆包AI智能修图升级到3.0版,依托SeedEdit 3.0模型,在文字编辑、局部修改等方面表现出色,突破传统图像编辑模型瓶颈,成为设计师工作利器,让AI修图‘所想即所得’。>阅读原文
Qwen2.5VL解锁看图讲故事玩法
CourseAI:Qwen2.5VL有新娱乐玩法,即看图讲故事。视觉叙事有挑战,基于StoryReasoning数据集微调Qwen Storyteller模型可解决,还给出实战代码。>阅读原文
Claude Code:重塑编程新体验
Claude Code首席工程师Boris称,该工具可在终端辅助编程,适配多环境,处理大型代码库能力强。加入Claude Max套餐可无限畅用。新模型让其更智能,编程将转向指挥AI智能体干活。>阅读原文
高伟翔:扣子生成荒诞商品
高伟翔:受淘宝荒诞商品启发,用扣子平台做荒诞商品生成器反思消费主义。毕业展反响不错,原设想批判情绪消费,后因观众喜好调整形式。>阅读原文
国产AI大模型写作文能力飙升
开源AI:去年评测国产AI模型写高考作文问题多,今年再测进步巨大,能力指数级提升、文采惊人。通义千问和文心一言扣题出色,海外模型Grok跑题、Gemini写万字长文“翻车”。>阅读原文
推荐文章
王绍翾:Data Warebase支撑AI工作流
ProtonBase CEO王绍翾指出,AI时代应用主要对接Data和AI两个API,大模型训练红利渐消,推理和数据应用成焦点。PostgreSQL凭扩展性和生态成行业标准,Data Warebase融合多能力,可支撑AI工作流。>阅读原文
作者:FB四年工作反思
作者总结在FB四年工作,原计划工作一年读phd,因申请失败延期。提出要明确目标、做有价值工作,还强调身体心理重要、坚持与同理心等,分享搭建ML模型及方法论心得。>阅读原文
产品经理AI编程的‘屎山’之路
作者:非技术出身用大模型编程,虽产出‘屎山’代码但有价值。经三次重构学会协作,总结沟通技巧,认为AI编程改变工作,未来产品经理需融合多角色能力。>阅读原文
一文看懂华为昇腾芯片
小枣君:华为昇腾芯片分狭义和广义定义,昇腾芯片是面向高性能AI计算的NPU芯片,有310、910、610等系列,华为基于芯片开发硬件体系,满足不同场景需求。>阅读原文
开发者:快乐工作提升生产力
Trisha Gee和Holly Cummins称,快乐是提升开发者生产力的秘诀,可通过减少摩擦、适时休息实现。使用AI要谨慎,衡量生产力不能只看传统指标,应解决实际问题。>阅读原文
开源动态
小红书开源自研大模型
小红书:开源自研大模型 dots.llm1,参数中等但性能佳。靠优质数据、高效训练‘以小搏大’,经多阶段微调表现亮眼,开源为与社区交流,也给开发者多一选择。>阅读原文
Mamba架构推理性能超Gemma3 - 27B
PromptCoT - Mamba:首个无注意力推理模型,在竞赛数学与代码推理评测上超Transformer等模型,去除注意力机制让显存和计算更优,为无注意力推理生态提供技术栈。>阅读原文
港科广&字节推ComfyMind框架
港科广与字节推出ComfyMind开源框架,能统一处理视觉生成任务。它以原子工作流为单位,结合多代理协同等策略,性能超开源方法,媲美GPT - 4o - Image。>阅读原文
小红书开源大模型dots.llm1
小红书hi lab团队推出开源大模型dots.llm1,参数小性能强,在多评测中表现佳。训练和数据处理有优势,还极大力度开源。国外网友认可,开发者也能借此低成本开发,潜力大值得期待。>阅读原文
算法论文
LLaDA 1.5:能力提升且有统一框架
中国人民大学与蚂蚁集团团队:基于 LLaDA 提出 VRPO 方法,推出 LLaDA 1.5。它在数学、代码、对齐任务上表现提升,VRPO 为扩散语言模型对齐提供统一框架,方法还具普适性。>阅读原文
Google:Multi - Agent核心是Prompt设计
Google&剑桥大学:多智能体系统中提示设计影响大,有效拓扑少。提出Mass框架分三阶段优化,实验显示在多任务上性能显著提升,有成本效益。>阅读原文
谷歌新模型超越Transformer
谷歌:提出新架构,参数减少、训练提速,性能超Transformer。引入注意力偏向和保留门,构建Moneta、Yaad、Memora新模型,在多任务表现优,解决原模型诸多问题。>阅读原文
多模态模型挑战地铁图评测
西湖大学等团队:提出评测基准ReasonMap评估多模态大模型‘看图’能力,主流开源模型有瓶颈,闭源模型虽好但不如人类,为模型优化指明方向。>阅读原文
大模型代码推荐存供应商偏见
西安交大等团队研究指出,大语言模型在代码推荐中有「供应商偏见」,会偏好特定供应商,甚至擅自修改代码,这会带来市场不公、侵害用户权益等问题,后续研究需拓展领域。>阅读原文
大模型多轮对话性能暴跌
研究人员:经超20万次模拟实验发现,大模型多轮对话表现明显差于单轮,平均性能降39%,出现‘对话迷失’,增加计算量也难改善。>阅读原文
</p>