机器之心

机器之心

专业的人工智能信息平台（www.jiqizhixin.com）

赞

91

|

搜索文章

蚂蚁出手VLA，就是开源超越Pi0.5的基座模型

一个机器人到底需要多「聪明」，你才愿意把它请进家门？前段时间，明星具身智能公司 1X 开始预售其人形机器人 Neo。演示视频中，它能从冰箱取水、叠衣服、把餐具放进洗碗机，俨然一个称职的家务助手。但

2月前
165
点赞
评论

DeepSeek又探索新架构了，开源OCR 2

嘿！DeepSeek 又更新了！这次是更新了十月份推出的 DeepSeek-OCR 模型（参见：太强了！DeepSeek 刚刚开源新模型，用视觉方式压缩一切）。当时 DeepSeek-OCR 的出

2月前
327
点赞
评论

性能比肩Gemini 3 Pro！昨晚，阿里千问最强模型来了

1 月 26 日深夜，阿里千问旗舰推理模型 Qwen3-Max-Thinking 正式上线。该模型在科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）、代码编程（Liv

2月前
651
2
4

百万围观、HuggingFace多模态登顶，华人团队开源语音版「DeepSeek」海外爆火

在大模型快速迭代的背景下，语音交互正从「语音转文本（ASR）— 文本理解 — 文本转语音（TTS」的串联式架构，逐步走向端到端的实时语音生成。这一转变不仅关系到延迟和自然度，也直接影响语音系统在真实生

2月前
170
点赞
评论

非Transformer架构的新突破，液态神经网络的推理小模型只用900M内存

谷歌 2017 年提出的 Transformer 架构事实上已经基本垄断了大模型。不采用 Transformer 架构的大模型已经是少之又少，而采用非 Transformer 架构，还能与主流第一梯

2月前
132
点赞
评论

拒绝成为落后的开发者：用TRAE Skills构建你的10倍效能工具箱

现在的 AI 编程领域，什么概念最热？毫无疑问是 Skill。在 X 上，一些分享 Skill 的帖子轻轻松松就能获得数十万的浏览量

2月前
813
2
评论

AI5芯片搞定，马斯克的纯自研超算Dojo 3又回来了

马斯克丢了个重磅炸弹：「AI5 芯片设计进展顺利，特斯拉将重启 Dojo3 的工作。」简单两句话，包含了特别大的信息量。 Dojo 项目是在 2021 年特斯拉 AI Day 首次提出，定位是「面

2月前
167
点赞
评论

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

临近春节，各家 AI 厂商进入冲刺阶段，纷纷亮出最新大模型成果。 1 月 15 日，美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模

2月前
180
点赞
评论

2026年，大模型训练的下半场属于「强化学习云」

2024 年底，硅谷和北京的茶水间里都在讨论同一个令人不安的话题：Scaling Law 似乎正在撞墙。那时候，尽管英伟达的股价还在狂飙，但多方信源显示，包括彼时备受期待的 Orion（原计划的 G

3月前
188
点赞
评论

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

在多模态大模型（MLLMs）领域，思维链（CoT）一直被视为提升推理能力的核心技术。然而，面对复杂的长程、视觉中心任务，这种基于文本生成的推理方式正面临瓶颈：文本难以精确追踪视觉信息的变化。形象地说，

3月前
142
点赞
评论

个人成就

优秀创作者

文章被点赞 11,811

文章被阅读 2,383,078

掘力值 95,218

加入于

2017-08-30