首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
机器之心
掘友等级
机器之心
专业的人工智能信息平台(www.jiqizhixin.com)
获得徽章 0
动态
文章
专栏
沸点
课程
收藏集
关注
作品
赞
91
文章 90
沸点 1
赞
91
返回
|
搜索文章
最新
热门
蚂蚁出手VLA,就是开源超越Pi0.5的基座模型
一个机器人到底需要多「聪明」,你才愿意把它请进家门? 前段时间,明星具身智能公司 1X 开始预售其人形机器人 Neo。演示视频中,它能从冰箱取水、叠衣服、把餐具放进洗碗机,俨然一个称职的家务助手。 但
DeepSeek又探索新架构了,开源OCR 2
嘿!DeepSeek 又更新了! 这次是更新了十月份推出的 DeepSeek-OCR 模型(参见:太强了!DeepSeek 刚刚开源新模型,用视觉方式压缩一切)。 当时 DeepSeek-OCR 的出
性能比肩Gemini 3 Pro!昨晚,阿里千问最强模型来了
1 月 26 日深夜,阿里千问旗舰推理模型 Qwen3-Max-Thinking 正式上线。 该模型在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(Liv
百万围观、HuggingFace多模态登顶,华人团队开源语音版「DeepSeek」海外爆火
在大模型快速迭代的背景下,语音交互正从「语音转文本(ASR)— 文本理解 — 文本转语音(TTS」的串联式架构,逐步走向端到端的实时语音生成。这一转变不仅关系到延迟和自然度,也直接影响语音系统在真实生
非Transformer架构的新突破,液态神经网络的推理小模型只用900M内存
谷歌 2017 年提出的 Transformer 架构事实上已经基本垄断了大模型。 不采用 Transformer 架构的大模型已经是少之又少,而采用非 Transformer 架构,还能与主流第一梯
拒绝成为落后的开发者:用TRAE Skills构建你的10倍效能工具箱
现在的 AI 编程领域,什么概念最热?毫无疑问是 Skill。 在 X 上,一些分享 Skill 的帖子轻轻松松就能获得数十万的浏览量
AI5芯片搞定,马斯克的纯自研超算Dojo 3又回来了
马斯克丢了个重磅炸弹: 「AI5 芯片设计进展顺利,特斯拉将重启 Dojo3 的工作。」 简单两句话,包含了特别大的信息量。 Dojo 项目是在 2021 年特斯拉 AI Day 首次提出,定位是「面
美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?
临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。 1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。 这是一款强大高效的大规模推理模
2026年,大模型训练的下半场属于「强化学习云」
2024 年底,硅谷和北京的茶水间里都在讨论同一个令人不安的话题:Scaling Law 似乎正在撞墙。 那时候,尽管英伟达的股价还在狂飙,但多方信源显示,包括彼时备受期待的 Orion(原计划的 G
多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案
在多模态大模型(MLLMs)领域,思维链(CoT)一直被视为提升推理能力的核心技术。然而,面对复杂的长程、视觉中心任务,这种基于文本生成的推理方式正面临瓶颈:文本难以精确追踪视觉信息的变化。形象地说,
下一页
个人成就
优秀创作者
文章被点赞
11,811
文章被阅读
2,383,078
掘力值
95,218
关注了
3
关注者
31,249
收藏集
0
关注标签
1
加入于
2017-08-30