首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
董董灿是个攻城狮
掘友等级
AI算法攻城狮
AI算法开发,公众号:董董灿是个攻城狮
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
24
文章 23
沸点 1
赞
24
返回
|
搜索文章
最新
热门
DeepSeek 技术原理大揭秘,爆肝 10 小时,一篇就够!(1/3)
DeepSeek 最近火爆全球,互联网上出现了大量关于 DeepSeek 使用和部署指南的文章。 比如我昨天就写了一篇:DeepSeek 本地部署,体验丝滑浏览器对话!。 同时,DeepSeek 引出
DeepSeek R1技术报告关键解析(10/10):如何进一步提升 AI 推理能力
## 1. AI 推理能力仍有待突破的领域 技术报告在最后还提到了一些未来的展望。 尽管 DeepSeek-R1 通过强化学习、多阶段训练、知识蒸馏等方法已经在推理任务上取得了巨大进展,但 AI
DeepSeek R1技术报告关键解析(9/10):强化学习也不是万能的
## 1. 强化学习并非万能工具 强化学习(Reinforcement Learning, RL)在 DeepSeek-R1 的推理能力提升方面起到了重要作用,使 AI 能够自主优化推理策略,提高数
DeepSeek R1技术报告关键解析(8/10):DeepSeek-R1 的“aha 时刻”,AI 自主学习的新突破
## 1. 什么是 AI 的“aha 时刻”? 在强化学习过程中,AI 的推理能力并不是线性增长的,而是会经历一些关键的“顿悟”时刻,研究人员将其称为**“aha 时刻”**。 这是 AI 在训练
DeepSeek R1技术报告关键解析(7/10):多阶段训练策略,如何优化 AI 的推理能力
## 1. 为什么 AI 需要多阶段训练? 在 AI 训练过程中,简单的单阶段训练往往难以让模型达到最佳推理能力。 AI 需要先学习基础知识,再逐步提升推理能力,同时避免生成低质量答案。因此,多阶
DeepSeek R1技术报告关键解析(6/10):DeepSeek-R1 vs. OpenAI-o1-1217:性能对比分析
## 1. 为什么要对比 DeepSeek-R1 和 OpenAI-o1-1217? 在当前的大模型竞争中,OpenAI 的 o1-1217 被认为是推理能力较强的模型之一。 而 DeepSee
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
## 1. 什么是知识蒸馏? 知识蒸馏(Knowledge Distillation)是一种让小模型从大模型学习的技术,类似于一位资深老师将自己的知识浓缩后,传授给学生。 大模型通常计算量大、推理
DeepSeek R1技术报告关键解析(4/10):拒绝采样(Rejection Sampling)让 AI 生成更靠谱的答案
# 1. 什么是拒绝采样(Rejection Sampling)? AI 生成的答案并不总是正确的,有时候它会输出胡言乱语、逻辑错误或者无意义的推理链。 如果不进行筛选,这些错误答案可能会影响模型
DeepSeek R1技术报告关键解析(3/10):冷启动数据让 AI 训练不再“摸黑”前进
#### **1. 什么是“冷启动数据”?** 在 AI 训练中,**“冷启动”(Cold Start)** 这个概念类似于刚买了一部新手机,开机后发现什么都没有,必须先安装应用、下载数据,才能正常
DeepSeek R1技术报告关键解析(2/10):DeepSeek-R1-Zero 首个纯强化学习推理大模型
**为什么 DeepSeek-R1-Zero 特别?** DeepSeek-R1-Zero 是**首个完全基于强化学习训练的推理大模型**,它在训练过程中**完全不依赖监督微调(Supervi
下一页
个人成就
优秀创作者
文章被点赞
690
文章被阅读
201,256
掘力值
6,578
关注了
2
关注者
320
收藏集
0
关注标签
8
加入于
2023-04-05