首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
贵慜_Derek
掘友等级
公众号IchbinDerek
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 3
沸点 4
赞
7
返回
|
搜索文章
最新
热门
DeepSeek 这些年的研究轨迹:他们在哪些方向上做布局?
前几天,DeepSeek 发布 V4,再度上热搜。回顾这些年,一篇篇论文,DeepSeek 在哪些方向持续布局?我们一起来看看。 主路:大语言模型本身,以及为「训得动、推得起」服务的一套东西——MoE
语言模型正在把“思考”迁到潜空间:五视角读懂《The Latent Space》综述
过去一段时间,latent space 这个词越来越常见。 但这个概念到底在讲什么?它又真正改变了什么? 这篇综述最有价值的地方,是没有停在抽象定义, 而是把问题拆成了五个可讨论、可对照的视角: Fo
Prefill-as-a-Service:为什么下一代模型的 KVCache 可以“跨机房”了
过去两年,行业在 LLM 推理优化上有一个看似正确、实际很容易把人带偏的默认前提: 我们把 Prefill-Decode(PD)解耦奉为标准动作,却默认它们必须困在同一个昂贵 RDMA 网络域里。 这
从传闻到结构:OpenMythos 对 Claude Mythos 的理论重建
当 Claude Mythos 用“发现成千上万零日漏洞”的新闻刷屏时,行业很容易掉进一种熟悉的情绪: 一边惊叹黑箱系统的能力,一边反复追问“它到底怎么做到的”,最后停在猜测。 这次有点不一样。 22
从堆参数到配计算:Looped Transformer 正在改写 AI 推理范式
一、引言:为什么需要“循环”? 当缩放定律长期指向“更大模型更强”时,Looped Transformer 走的是另一条路: 深度不一定要用参数购买,能不能用计算复用来获得? 如果把标准 Transf
我们能从EdgeClaw学习到哪些优秀的技术架构设计
先看一张很多团队都不陌生的复盘单: 事故触发:低价路由命中高风险请求 扩散路径:工具调用穿透到外部系统 处置结果:当晚回滚,次日补规则,三天补审计 这类事故有个共同点:不是系统“不会做事”,而是系统“
我们能从ChatGPT学习到哪些优秀的技术架构设计
我见过不少“ChatGPT 架构复刻”项目,白天演示都很顺,晚上一上真实流量就开始报警: 工具重复调用、上下文漂移、动作越权、故障定位要靠猜。 问题通常不在模型智商,而在系统纪律。 ChatGPT 真
我们能从 Claude Code 学习到哪些优秀的技术架构设计
凌晨两点,Agent 还在自己改代码、跑命令、调工具。 真正让人紧张的从来不是“它会不会”,而是“它这一轮失控了谁来兜底”。 我想聊的 Claude Code,不是功能秀,而是一套把高自主行为压进工程
我们能从 DeerFlow 学到哪些优秀的技术架构设计
对于一个优秀的Agent系统,“会不会更多技能”决定其上限,“会不会稳定犯错”则决定其生死。 因此,聊 Agent 架构时我越来越少看功能清单,越来越多看运行时纪律:请求怎么进、动作谁裁决、失败怎么收
我们能从OpenClaw学习到哪些优秀的技术架构设计
去年底,OpenClaw突然爆火,引发全民养“龙虾”的热潮,甚至逼得Anthropic“封杀”OpenClaw。那么,OpenClaw架构设计有哪些迷人的地方,竟然能从Claude Code、Chat
下一页
个人成就
文章被点赞
7
文章被阅读
7,209
掘力值
592
关注了
1
关注者
1
收藏集
0
关注标签
0
加入于
2026-03-19