首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
董董灿是个攻城狮
掘友等级
AI算法攻城狮
AI算法开发,公众号:董董灿是个攻城狮
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
24
文章 23
沸点 1
赞
24
返回
|
搜索文章
最新
热门
DeepSeek 的含金量还在上升
大家好啊,我是董董灿。 最近 DeepSeek 越来越火了。 网上有很多针对 DeepSeek 的推理测评,除此之外,也有很多人从技术的角度来探讨 DeepSeek 带给行业的影响。 比如今天
DeepSeek 技术原理大揭秘,爆肝 10 小时,一篇就够!(1/3)
DeepSeek 最近火爆全球,互联网上出现了大量关于 DeepSeek 使用和部署指南的文章。 比如我昨天就写了一篇:DeepSeek 本地部署,体验丝滑浏览器对话!。 同时,DeepSeek 引出
DeepSeek-R1 和 DeepSeek-R1-Zero 的区别(通俗版)
DeepSeek-R1 和 DeepSeek-R1-Zero 都是 **DeepSeek 团队推出的大模型**,它们的核心目标是提升推理能力,特别是在数学、代码和复杂问题解决方面。但它们的训练方式和
DeepSeek R1技术报告关键解析(1/10):强化学习如何提升 AI 推理能力
#### 让 AI 自己“摸索”答案,而不是单纯“背答案” 过去的 AI 训练方式主要依赖**监督学习(Supervised Learning)**,也就是让 AI 通过大量人类标注的数据来学习。
DeepSeek-R1 技术报告精华整理:通过强化学习提升大模型推理能力
# DeepSeek-R1:通过强化学习提升大模型推理能力 ## 介绍 近年来,大语言模型(LLM)快速发展,逐步缩小了与通用人工智能(AGI)之间的差距。后训练(Post-Training)已成
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
## 1. 什么是知识蒸馏? 知识蒸馏(Knowledge Distillation)是一种让小模型从大模型学习的技术,类似于一位资深老师将自己的知识浓缩后,传授给学生。 大模型通常计算量大、推理
DeepSeek R1技术报告关键解析(2/10):DeepSeek-R1-Zero 首个纯强化学习推理大模型
**为什么 DeepSeek-R1-Zero 特别?** DeepSeek-R1-Zero 是**首个完全基于强化学习训练的推理大模型**,它在训练过程中**完全不依赖监督微调(Supervi
DeepSeek R1技术报告关键解析(3/10):冷启动数据让 AI 训练不再“摸黑”前进
#### **1. 什么是“冷启动数据”?** 在 AI 训练中,**“冷启动”(Cold Start)** 这个概念类似于刚买了一部新手机,开机后发现什么都没有,必须先安装应用、下载数据,才能正常
DeepSeek R1技术报告关键解析(4/10):拒绝采样(Rejection Sampling)让 AI 生成更靠谱的答案
# 1. 什么是拒绝采样(Rejection Sampling)? AI 生成的答案并不总是正确的,有时候它会输出胡言乱语、逻辑错误或者无意义的推理链。 如果不进行筛选,这些错误答案可能会影响模型
DeepSeek R1技术报告关键解析(6/10):DeepSeek-R1 vs. OpenAI-o1-1217:性能对比分析
## 1. 为什么要对比 DeepSeek-R1 和 OpenAI-o1-1217? 在当前的大模型竞争中,OpenAI 的 o1-1217 被认为是推理能力较强的模型之一。 而 DeepSee
下一页
个人成就
优秀创作者
文章被点赞
690
文章被阅读
201,257
掘力值
6,578
关注了
2
关注者
320
收藏集
0
关注标签
8
加入于
2023-04-05