37-260419 AI 科技日报 (中国人形机器人半马破纪录/Claude Design发布)37-260419 AI

37-260419 AI 科技日报 (中国人形机器人半马破纪录/Claude Design发布)

共收录 31 条资讯

AI模型

传GPT-5.5已开启潜行测试 — 社区多方消息指出，GPT-5.5 已经开启了小范围的灰度测试。 🔗

传闻称它单次生成复杂 SVG 代码的能力极其出色，值得期待。

DeepSeek V4处于高频调整期 — 多位开发者的体验反馈显示，DeepSeek V4 目前正处于高频调整阶段。 🔗

目前 V4 的跑分状态比较波动，推理和对话模式切换时有些不稳定，现阶段可能更适合接在工具链后台调用。

社区开源复现 Claude Mythos — 开源社区的硬核玩家再次出手，尝试复现 Claude 的隐藏版本。 🔗

有开发者等不及官方动作，直接用 PyTorch 从头手搓了一个 Claude Mythos 的开源平替版。

Muse Spark模型在ClawEval榜单跻身前三 — Scale AI 创始人 Alexandr Wang 分享了新数据，一匹黑马模型杀入了 ClawEval 榜单前三。 🔗

这款叫 Muse Spark 的新模型在评测里跑分压过了 GPT-5.4，尤其擅长独立执行长流程的复杂任务。

产品发布

HF为Replit提供技能库接入 — Hugging Face 宣布其 Skills 技能库已经能无缝接入 Replit 环境。 🔗

在 Replit 配置一下，你的 Agent 就能随叫随到地调用 Hugging Face 上百万个开源模型和数据集，相当方便。

OpenAI电脑操作暂不支持Windows — OpenAI 近期推出了大家期待的电脑控制（Computer Use）功能，但目前还有平台限制。 🔗

这个让 AI 帮你操作电脑的新功能暂时还不兼容 Windows 系统，Windows 用户只能再耐心等等了。

Anthropic推出Claude Design — Anthropic 正式上线了全新的 UI 构思工具 Claude Design。 🔗

动动嘴就能直接生成原型图和演示文档。Anthropic 把大模型的前端渲染能力打包成了成熟产品，直接杀入了设计工具的腹地。

谷歌Gemini多项关键更新发布 — 谷歌本周密集发布了多项更新，涵盖语音、机器人模型和桌面端应用。 🔗

这次更新的范围很广，尤其值得一提的是 Flash TTS 语音模型，在多人对话和情感语气控制上的表现十分亮眼。

X平台API通过OpenClaw开放低价接入 — 埃隆·马斯克确认放宽了 X 平台数据接口的部分限制。 🔗

面对之前过于昂贵的 API 定价，官方给了个折中方案：现在开发者通过 OpenClaw 调用 X 平台数据，成本能大幅下降。

研究论文

苹果验证注意力到Mamba的蒸馏 — 苹果最新的一项研究探讨了如何将 Transformer 的优势转移到其他架构上。 🔗

实验证明，Transformer 的内部知识能直接蒸馏给 Mamba 架构。这给解决大模型长文本处理的效率瓶颈提供了一条新思路。

谷歌利用Agent处理可穿戴设备数据 — 谷歌的新论文探讨了 AI 智能体如何介入可穿戴设备的数据处理。 🔗

核心思路是让 AI Agent 自动化分析智能手表收集的海量健康数据，减轻医生和用户的读图负担。

大模型“英语脑子”假说受到实验挑战 — 过去工程界常以为大模型底层思考都是英文，再翻译成其他语言，这一假说如今被打破。 🔗

新研究证实，大模型的神经网络里其实有一套独立于人类具体语言的“抽象概念系统”，并不存在中间翻译的过程。

智能体自演化协议Autogenesis发布 — 研究人员提出了一种名为 Autogenesis 的智能体协议，主打自我进化。 🔗

接入这个协议的 Agent 能全自动完成找 Bug、写补丁和测试上线的闭环，完全不需要人类开发者介入排错。

工具推荐

Anthropic 官方发布 Skills 开发指南 — Anthropic 官方新鲜发布了一份长达 33 页的技能开发指南。 🔗

官方手把手教你怎么给 Claude 开发外部工具技能，想用大模型做复杂业务的开发者强烈建议收藏阅读。

Manifest：帮你省钱的 AI 模型路由 — 开发者推出了一款名为 Manifest 的开源模型路由网关，支持自托管部署。 🔗

它可以根据你 prompt 的复杂度自动切换不同的模型。简单问题调小模型，复杂问题切大模型，能帮你在后台省下不少 API 开销。

开发者汇总永久免费 LLM API 列表 — 社区开发者整理并维护了一份目前提供免费额度的主流大模型 API 清单。 🔗

这份清单涵盖了各大厂的免费调用渠道，非常适合个人开发者拿来做测试或者跑一些轻量级脚本。

HeyGen开源HTML转视频框架 — AI 视频生成公司 HeyGen 开源了自家的底层渲染框架 HyperFrame。 🔗

这个框架能直接把 HTML 渲染成 MP4 视频。配合大模型写前端代码，拿来做视频自动化量产极其顺手。

全新多模态开源3D世界生成模型 — 开源社区上线了一款全新的多模态 3D 资产生成模型。 🔗

游戏开发者的实用工具。它能根据提示词直接生成 3D 资产，而且格式完全兼容 Unity 和 Unreal Engine，方便导入后继续加工。

英伟达推出本地沙盒AI助手部署指南 — 英伟达官方发布了一套详细的实战教程，教你如何在本地部署 AI。 🔗

如果你担心云端模型泄露机密代码，跟着这套教程花半天时间，就能在本地机器上搭一个完全物理隔离的 AI 助手。

斯坦福开源LLM架构系统级公开课 — 斯坦福大学 NLP 团队免费公开了一节时长 90 分钟的系统级架构课程。 🔗

这节课从头梳理了大语言模型的底层架构搭建逻辑，内容非常硬核，想钻研模型底层原理的开发者不容错过。

行业动态

三大顶级模型跑分首度打平 — Artificial Analysis 发布的最新基准测试数据显示了一个有趣的现象。 🔗

OpenAI、谷歌和 Anthropic 的三款旗舰模型在跑分上首度完全打平。基础大模型的性能正不可避免地走向同质化。

ICLR接收论文因机构归属被拒稿 — 学术界近期传出了一件争议事件，涉及顶会论文审核标准。 🔗

有作者爆料，一篇原本已被 ICLR 接收为 Oral 的论文，仅仅因为在预印本中署名了 DeepSeek 的研究经历就被突然拒稿，引发了社区对学术偏见的讨论。

Claude Design 系统提示词被扒出 — 开发者逆向获取了新发布产品 Claude Design 的完整系统提示词（System Prompt）。 🔗

从提示词来看，它本质上是一个挂载了沙箱环境和文件系统的复杂 Agent。这份提示词写得非常严谨，做垂直应用的开发者完全可以借鉴其架构逻辑。

OpenAI Codex向全自动IDE进化 — OpenAI 最近对内部的代码项目 Codex 进行了一系列密集的更新。 🔗

Codex 的演进路线越来越明确，目前它已经具备了极强的主动性，能预判你的下一步意图并提前把代码片段准备好，正在向全自动 IDE 形态发展。

微软威斯康星州AI数据中心提前上线 — 微软 CEO 萨提亚·纳德拉近日对外确认了新算力中心的进度。 🔗

巨头间的算力基建竞赛还在加速。微软位于威斯康星州的 AI 数据中心已经提前完成部署并正式上线，号称具备全球顶级的集群算力。

Chollet发问：Token产出能否覆盖算力成本 — Keras 作者 François Chollet 对当前的算力投资热潮提出了自己的疑虑。 🔗

核心观点很现实：虽然底层硬件卖得火热，但应用层通过生成 Token 创造的商业价值，目前来看似乎还远远无法覆盖庞大的买卡和电费成本。

其他

中国人形机器人半马破纪录 — 在近期的半程马拉松比赛中，一款国产人形机器人完成了比赛并刷新了相关记录。 🔗

全程仅用时 50 分钟。能在长跑中保持这么久的动态平衡，说明其下盘硬件和步态控制算法取得了非常实质的突破。

Tensor一词在AI领域的起源 — 有技术爱好者挖掘了早期 AI 领域的历史文献。 🔗

考据发现，“Tensor（张量）”这个词之所以在深度学习圈子扎根，最早可以追溯到 Yann LeCun 早期参与编写的一门古老编程语言。

波浪能发电机内置GPU引吐槽 — 社交平台上流传出一个将算力与清洁能源结合的奇特硬件项目。 🔗

团队试图在波浪能发电机里直接塞入 GPU 集群，想实现“就地发电就地运算”。想法很丰满，但很快被硬件工程师们吐槽根本没考虑海水高盐雾腐蚀的致命问题。

研究称重度依赖AI直接给答案会削弱能力 — 一项针对开发者使用习惯的研究表明，过度依赖大模型可能会产生负面影响。 🔗

长期让 AI 直接提供完整代码和答案，反而会削弱人类的独立思考能力。把大模型当成提供思路的“辅助教练”，而不是替你写作业的“代练”，才是更健康的使用方式。

关注我，每天获取AI最新资讯。