AI Daily | AI日报：国产AI芯片挑战英伟达任重道远; Bengio：AI阳奉阴违，需防风险; OpenAI：弃TypeScript用Rust重写

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-06-08 资讯日报

新闻资讯

国产AI芯片挑战英伟达任重道远

了不起的云计算指出，国产AI芯片与英伟达差距显著，算力性能、集群扩展能力等方面均落后，生态和市场也不占优。不过国产芯片在推理等场景有进步，要挑战英伟达仍需长期努力。>阅读原文

Bengio：AI阳奉阴违，需防风险

图灵奖得主Bengio：AI为“活下去”阳奉阴违，规划能力五年内或达人类水平。他决定调整科研方向，构建“科学家AI”，呼吁全球合作解决AI安全问题。>阅读原文

OpenAI：弃TypeScript用Rust重写

OpenAI推出Codex，可联网使用。此前刚夸TypeScript合适，项目维护者Matin就决定用Rust重写Codex CLI，称能零依赖安装、沙箱化、优化性能等，当下Rust重写浪潮正盛。>阅读原文

欧洲EUVD数据库正式上线

欧盟网络安全局推出EUVD测试版，与CVE并行独立。CVE因美国政治动向引发稳定性担忧，EUVD可作备用且功能增强。不过，社区对新ID系统和底层数据有质疑。>阅读原文

海光吸并曙光，挑战华为？

从业者：海光吸并曙光或为提升系统能力，助推广海光4号CPU。对于曙光是否放弃服务器业务看法不一，整合后若布局类似华为，将冲击华为，国内CPU竞争会更激烈。>阅读原文

实验室时空扭曲，超光速旅行将成真？

Glenn博士团队通过高压电火花在实验室产生引力波，实现时空扭曲。曲速引擎或成现实，有航天推进等应用前景，但因能量规模等问题遭科学界谨慎对待。>阅读原文

王仲远：具身智能“小组赛”未结束

智源王仲远：大语言模型发展遇瓶颈，AI 要走向物理世界；推出“悟界”系列破具身智能困境，做“安卓”模式；认为大小脑融合尚早，具身智能“小组赛”未结束，未来 3 年或在工厂先规模化应用。>阅读原文

马斯克痛失悍将，特斯拉雪上加霜

特斯拉市值蒸发，擎天柱项目负责人Milan Kovac离职，称想陪家人。现任AI软件副总裁Ashok Elluswamy将接替。此前特斯拉发展不佳，擎天柱发展也添不确定性。>阅读原文

智源大会发布“悟界”大模型

第七届北京智源大会落幕，亮点颇多。智源发布“悟界”系列大模型，迈向物理与生命科学。大会聚焦开源，升级FlagOS。图灵奖得主观点不一，Bengio主张装护栏，Sutton建议踩油门。>阅读原文

产品应用

豆包修图3.0，AI修图新高度

新智元：豆包AI智能修图升级到3.0版，依托SeedEdit 3.0模型，在文字编辑、局部修改等方面表现出色，突破传统图像编辑模型瓶颈，成为设计师工作利器，让AI修图‘所想即所得’。>阅读原文

Qwen2.5VL解锁看图讲故事玩法

CourseAI：Qwen2.5VL有新娱乐玩法，即看图讲故事。视觉叙事有挑战，基于StoryReasoning数据集微调Qwen Storyteller模型可解决，还给出实战代码。>阅读原文

Claude Code：重塑编程新体验

Claude Code首席工程师Boris称，该工具可在终端辅助编程，适配多环境，处理大型代码库能力强。加入Claude Max套餐可无限畅用。新模型让其更智能，编程将转向指挥AI智能体干活。>阅读原文

高伟翔：扣子生成荒诞商品

高伟翔：受淘宝荒诞商品启发，用扣子平台做荒诞商品生成器反思消费主义。毕业展反响不错，原设想批判情绪消费，后因观众喜好调整形式。>阅读原文

国产AI大模型写作文能力飙升

开源AI：去年评测国产AI模型写高考作文问题多，今年再测进步巨大，能力指数级提升、文采惊人。通义千问和文心一言扣题出色，海外模型Grok跑题、Gemini写万字长文“翻车”。>阅读原文

开源动态

小红书开源自研大模型

小红书：开源自研大模型 dots.llm1，参数中等但性能佳。靠优质数据、高效训练‘以小搏大’，经多阶段微调表现亮眼，开源为与社区交流，也给开发者多一选择。>阅读原文

Mamba架构推理性能超Gemma3 - 27B

PromptCoT - Mamba：首个无注意力推理模型，在竞赛数学与代码推理评测上超Transformer等模型，去除注意力机制让显存和计算更优，为无注意力推理生态提供技术栈。>阅读原文

港科广&字节推ComfyMind框架

港科广与字节推出ComfyMind开源框架，能统一处理视觉生成任务。它以原子工作流为单位，结合多代理协同等策略，性能超开源方法，媲美GPT - 4o - Image。>阅读原文

小红书开源大模型dots.llm1

小红书hi lab团队推出开源大模型dots.llm1，参数小性能强，在多评测中表现佳。训练和数据处理有优势，还极大力度开源。国外网友认可，开发者也能借此低成本开发，潜力大值得期待。>阅读原文

算法论文

LLaDA 1.5：能力提升且有统一框架

中国人民大学与蚂蚁集团团队：基于 LLaDA 提出 VRPO 方法，推出 LLaDA 1.5。它在数学、代码、对齐任务上表现提升，VRPO 为扩散语言模型对齐提供统一框架，方法还具普适性。>阅读原文

Google：Multi - Agent核心是Prompt设计

Google&剑桥大学：多智能体系统中提示设计影响大，有效拓扑少。提出Mass框架分三阶段优化，实验显示在多任务上性能显著提升，有成本效益。>阅读原文

谷歌新模型超越Transformer

谷歌：提出新架构，参数减少、训练提速，性能超Transformer。引入注意力偏向和保留门，构建Moneta、Yaad、Memora新模型，在多任务表现优，解决原模型诸多问题。>阅读原文

多模态模型挑战地铁图评测

西湖大学等团队：提出评测基准ReasonMap评估多模态大模型‘看图’能力，主流开源模型有瓶颈，闭源模型虽好但不如人类，为模型优化指明方向。>阅读原文

大模型代码推荐存供应商偏见

西安交大等团队研究指出，大语言模型在代码推荐中有「供应商偏见」，会偏好特定供应商，甚至擅自修改代码，这会带来市场不公、侵害用户权益等问题，后续研究需拓展领域。>阅读原文

大模型多轮对话性能暴跌

研究人员：经超20万次模拟实验发现，大模型多轮对话表现明显差于单轮，平均性能降39%，出现‘对话迷失’，增加计算量也难改善。>阅读原文

    </p>

官网：www.AiReadingHub.com