37-260419 AI 科技日报 (中国人形机器人半马破纪录/Claude Design发布)

0 阅读9分钟

37-260419 AI 科技日报 (中国人形机器人半马破纪录/Claude Design发布)

共收录 31 条资讯

AI模型

  1. 传GPT-5.5已开启潜行测试 — 社区多方消息指出,GPT-5.5 已经开启了小范围的灰度测试。 🔗

传闻称它单次生成复杂 SVG 代码的能力极其出色,值得期待。

  1. DeepSeek V4处于高频调整期 — 多位开发者的体验反馈显示,DeepSeek V4 目前正处于高频调整阶段。 🔗

目前 V4 的跑分状态比较波动,推理和对话模式切换时有些不稳定,现阶段可能更适合接在工具链后台调用。

  1. 社区开源复现 Claude Mythos — 开源社区的硬核玩家再次出手,尝试复现 Claude 的隐藏版本。 🔗

有开发者等不及官方动作,直接用 PyTorch 从头手搓了一个 Claude Mythos 的开源平替版。

  1. Muse Spark模型在ClawEval榜单跻身前三 — Scale AI 创始人 Alexandr Wang 分享了新数据,一匹黑马模型杀入了 ClawEval 榜单前三。 🔗

这款叫 Muse Spark 的新模型在评测里跑分压过了 GPT-5.4,尤其擅长独立执行长流程的复杂任务。

产品发布

  1. HF为Replit提供技能库接入 — Hugging Face 宣布其 Skills 技能库已经能无缝接入 Replit 环境。 🔗

在 Replit 配置一下,你的 Agent 就能随叫随到地调用 Hugging Face 上百万个开源模型和数据集,相当方便。

  1. OpenAI电脑操作暂不支持Windows — OpenAI 近期推出了大家期待的电脑控制(Computer Use)功能,但目前还有平台限制。 🔗

这个让 AI 帮你操作电脑的新功能暂时还不兼容 Windows 系统,Windows 用户只能再耐心等等了。

  1. Anthropic推出Claude Design — Anthropic 正式上线了全新的 UI 构思工具 Claude Design。 🔗

动动嘴就能直接生成原型图和演示文档。Anthropic 把大模型的前端渲染能力打包成了成熟产品,直接杀入了设计工具的腹地。

  1. 谷歌Gemini多项关键更新发布 — 谷歌本周密集发布了多项更新,涵盖语音、机器人模型和桌面端应用。 🔗

这次更新的范围很广,尤其值得一提的是 Flash TTS 语音模型,在多人对话和情感语气控制上的表现十分亮眼。

  1. X平台API通过OpenClaw开放低价接入 — 埃隆·马斯克确认放宽了 X 平台数据接口的部分限制。 🔗

面对之前过于昂贵的 API 定价,官方给了个折中方案:现在开发者通过 OpenClaw 调用 X 平台数据,成本能大幅下降。

研究论文

  1. 苹果验证注意力到Mamba的蒸馏 — 苹果最新的一项研究探讨了如何将 Transformer 的优势转移到其他架构上。 🔗

实验证明,Transformer 的内部知识能直接蒸馏给 Mamba 架构。这给解决大模型长文本处理的效率瓶颈提供了一条新思路。

  1. 谷歌利用Agent处理可穿戴设备数据 — 谷歌的新论文探讨了 AI 智能体如何介入可穿戴设备的数据处理。 🔗

核心思路是让 AI Agent 自动化分析智能手表收集的海量健康数据,减轻医生和用户的读图负担。

  1. 大模型“英语脑子”假说受到实验挑战 — 过去工程界常以为大模型底层思考都是英文,再翻译成其他语言,这一假说如今被打破。 🔗

新研究证实,大模型的神经网络里其实有一套独立于人类具体语言的“抽象概念系统”,并不存在中间翻译的过程。

  1. 智能体自演化协议Autogenesis发布 — 研究人员提出了一种名为 Autogenesis 的智能体协议,主打自我进化。 🔗

接入这个协议的 Agent 能全自动完成找 Bug、写补丁和测试上线的闭环,完全不需要人类开发者介入排错。

工具推荐

  1. Anthropic 官方发布 Skills 开发指南 — Anthropic 官方新鲜发布了一份长达 33 页的技能开发指南。 🔗

官方手把手教你怎么给 Claude 开发外部工具技能,想用大模型做复杂业务的开发者强烈建议收藏阅读。

  1. Manifest:帮你省钱的 AI 模型路由 — 开发者推出了一款名为 Manifest 的开源模型路由网关,支持自托管部署。 🔗

它可以根据你 prompt 的复杂度自动切换不同的模型。简单问题调小模型,复杂问题切大模型,能帮你在后台省下不少 API 开销。

  1. 开发者汇总永久免费 LLM API 列表 — 社区开发者整理并维护了一份目前提供免费额度的主流大模型 API 清单。 🔗

这份清单涵盖了各大厂的免费调用渠道,非常适合个人开发者拿来做测试或者跑一些轻量级脚本。

  1. HeyGen开源HTML转视频框架 — AI 视频生成公司 HeyGen 开源了自家的底层渲染框架 HyperFrame。 🔗

这个框架能直接把 HTML 渲染成 MP4 视频。配合大模型写前端代码,拿来做视频自动化量产极其顺手。

  1. 全新多模态开源3D世界生成模型 — 开源社区上线了一款全新的多模态 3D 资产生成模型。 🔗

游戏开发者的实用工具。它能根据提示词直接生成 3D 资产,而且格式完全兼容 Unity 和 Unreal Engine,方便导入后继续加工。

  1. 英伟达推出本地沙盒AI助手部署指南 — 英伟达官方发布了一套详细的实战教程,教你如何在本地部署 AI。 🔗

如果你担心云端模型泄露机密代码,跟着这套教程花半天时间,就能在本地机器上搭一个完全物理隔离的 AI 助手。

  1. 斯坦福开源LLM架构系统级公开课 — 斯坦福大学 NLP 团队免费公开了一节时长 90 分钟的系统级架构课程。 🔗

这节课从头梳理了大语言模型的底层架构搭建逻辑,内容非常硬核,想钻研模型底层原理的开发者不容错过。

行业动态

  1. 三大顶级模型跑分首度打平 — Artificial Analysis 发布的最新基准测试数据显示了一个有趣的现象。 🔗

OpenAI、谷歌和 Anthropic 的三款旗舰模型在跑分上首度完全打平。基础大模型的性能正不可避免地走向同质化。

  1. ICLR接收论文因机构归属被拒稿 — 学术界近期传出了一件争议事件,涉及顶会论文审核标准。 🔗

有作者爆料,一篇原本已被 ICLR 接收为 Oral 的论文,仅仅因为在预印本中署名了 DeepSeek 的研究经历就被突然拒稿,引发了社区对学术偏见的讨论。

  1. Claude Design 系统提示词被扒出 — 开发者逆向获取了新发布产品 Claude Design 的完整系统提示词(System Prompt)。 🔗

从提示词来看,它本质上是一个挂载了沙箱环境和文件系统的复杂 Agent。这份提示词写得非常严谨,做垂直应用的开发者完全可以借鉴其架构逻辑。

  1. OpenAI Codex向全自动IDE进化 — OpenAI 最近对内部的代码项目 Codex 进行了一系列密集的更新。 🔗

Codex 的演进路线越来越明确,目前它已经具备了极强的主动性,能预判你的下一步意图并提前把代码片段准备好,正在向全自动 IDE 形态发展。

  1. 微软威斯康星州AI数据中心提前上线 — 微软 CEO 萨提亚·纳德拉近日对外确认了新算力中心的进度。 🔗

巨头间的算力基建竞赛还在加速。微软位于威斯康星州的 AI 数据中心已经提前完成部署并正式上线,号称具备全球顶级的集群算力。

  1. Chollet发问:Token产出能否覆盖算力成本 — Keras 作者 François Chollet 对当前的算力投资热潮提出了自己的疑虑。 🔗

核心观点很现实:虽然底层硬件卖得火热,但应用层通过生成 Token 创造的商业价值,目前来看似乎还远远无法覆盖庞大的买卡和电费成本。

其他

  1. 中国人形机器人半马破纪录 — 在近期的半程马拉松比赛中,一款国产人形机器人完成了比赛并刷新了相关记录。 🔗

全程仅用时 50 分钟。能在长跑中保持这么久的动态平衡,说明其下盘硬件和步态控制算法取得了非常实质的突破。

  1. Tensor一词在AI领域的起源 — 有技术爱好者挖掘了早期 AI 领域的历史文献。 🔗

考据发现,“Tensor(张量)”这个词之所以在深度学习圈子扎根,最早可以追溯到 Yann LeCun 早期参与编写的一门古老编程语言。

  1. 波浪能发电机内置GPU引吐槽 — 社交平台上流传出一个将算力与清洁能源结合的奇特硬件项目。 🔗

团队试图在波浪能发电机里直接塞入 GPU 集群,想实现“就地发电就地运算”。想法很丰满,但很快被硬件工程师们吐槽根本没考虑海水高盐雾腐蚀的致命问题。

  1. 研究称重度依赖AI直接给答案会削弱能力 — 一项针对开发者使用习惯的研究表明,过度依赖大模型可能会产生负面影响。 🔗

长期让 AI 直接提供完整代码和答案,反而会削弱人类的独立思考能力。把大模型当成提供思路的“辅助教练”,而不是替你写作业的“代练”,才是更健康的使用方式。


关注我,每天获取AI最新资讯。

2c25c21c60faac8169dda051387a2606.jpg