首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
董董灿是个攻城狮
掘友等级
AI算法攻城狮
AI算法开发,公众号:董董灿是个攻城狮
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
24
文章 23
沸点 1
赞
24
返回
|
搜索文章
董董灿是个攻城狮
AI算法攻城狮
·
7月前
关注
一文看懂 Claude 3.7 Sonnet,为什么是第一个融合推理模式的 AI 模型
## 1. Claude 3.7 Sonnet 有何特别之处? Claude 3.7 Sonnet 是 Anthropic 最新发布的 AI 模型,发布过程中,最突出最吸...
2
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek 技术原理大揭秘,爆肝 10 小时,一篇就够!(1/3)
DeepSeek 最近火爆全球,互联网上出现了大量关于 DeepSeek 使用和部署指南的文章。 比如我昨天就写了一篇:DeepSeek 本地部署,体验丝滑浏览器对话!。 ...
9
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(10/10):如何进一步提升 AI 推理能力
## 1. AI 推理能力仍有待突破的领域 技术报告在最后还提到了一些未来的展望。 尽管 DeepSeek-R1 通过强化学习、多阶段训练、知识蒸馏等方法已经在推理任务上取...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(9/10):强化学习也不是万能的
## 1. 强化学习并非万能工具 强化学习(Reinforcement Learning, RL)在 DeepSeek-R1 的推理能力提升方面起到了重要作用,使 AI 能...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(8/10):DeepSeek-R1 的“aha 时刻”,AI 自主学习的新突破
## 1. 什么是 AI 的“aha 时刻”? 在强化学习过程中,AI 的推理能力并不是线性增长的,而是会经历一些关键的“顿悟”时刻,研究人员将其称为**“aha 时刻”*...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(7/10):多阶段训练策略,如何优化 AI 的推理能力
## 1. 为什么 AI 需要多阶段训练? 在 AI 训练过程中,简单的单阶段训练往往难以让模型达到最佳推理能力。 AI 需要先学习基础知识,再逐步提升推理能力,同时避免生...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(6/10):DeepSeek-R1 vs. OpenAI-o1-1217:性能对比分析
## 1. 为什么要对比 DeepSeek-R1 和 OpenAI-o1-1217? 在当前的大模型竞争中,OpenAI 的 o1-1217 被认为是推理能力较强的模型之一...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
## 1. 什么是知识蒸馏? 知识蒸馏(Knowledge Distillation)是一种让小模型从大模型学习的技术,类似于一位资深老师将自己的知识浓缩后,传授给学生。 ...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(4/10):拒绝采样(Rejection Sampling)让 AI 生成更靠谱的答案
# 1. 什么是拒绝采样(Rejection Sampling)? AI 生成的答案并不总是正确的,有时候它会输出胡言乱语、逻辑错误或者无意义的推理链。 如果不进行筛选,这...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(3/10):冷启动数据让 AI 训练不再“摸黑”前进
#### **1. 什么是“冷启动数据”?** 在 AI 训练中,**“冷启动”(Cold Start)** 这个概念类似于刚买了一部新手机,开机后发现什么都没有,必须先安...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(2/10):DeepSeek-R1-Zero 首个纯强化学习推理大模型
**为什么 DeepSeek-R1-Zero 特别?** DeepSeek-R1-Zero 是**首个完全基于强化学习训练的推理大模型**,它在训练过程中**完全不依赖监...
2
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek R1技术报告关键解析(1/10):强化学习如何提升 AI 推理能力
#### 让 AI 自己“摸索”答案,而不是单纯“背答案” 过去的 AI 训练方式主要依赖**监督学习(Supervised Learning)**,也就是让 AI 通过大...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek-R1 和 DeepSeek-R1-Zero 的区别(通俗版)
DeepSeek-R1 和 DeepSeek-R1-Zero 都是 **DeepSeek 团队推出的大模型**,它们的核心目标是提升推理能力,特别是在数学、代码和复杂问题解...
4
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek-R1 技术报告精华整理:通过强化学习提升大模型推理能力
# DeepSeek-R1:通过强化学习提升大模型推理能力 ## 介绍 近年来,大语言模型(LLM)快速发展,逐步缩小了与通用人工智能(AGI)之间的差距。后训练(Post...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
DeepSeek 的含金量还在上升
大家好啊,我是董董灿。 最近 DeepSeek 越来越火了。 网上有很多针对 DeepSeek 的推理测评,除此之外,也有很多人从技术的角度来探讨 DeepSeek 带给行...
5
评论
分享
董董灿是个攻城狮
赞了这篇文章
程序员X小鹿
大数据开发 @字节跳动
·
8月前
关注
国产AI杀疯了,吊打ChatGPT!一文读懂DeepSeek:DeepSeek入门最全教程!(新手必看)
国产大模型杀疯了!当所有人还在讨论“算力霸权”时,一家中国公司用实力宣告: 堆显卡、拼硬件的时代,结束了! 最近,各大热搜榜几乎被 DeepSeek 屠榜,连央视也接连报道...
15
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
023:到底什么是感受野?
> 本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请查看[这里](https://mp.weixin.qq.com/s?__biz=MzAwOT...
1
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
022、什么是卷积的特征图?
本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请查看[这里](https://mp.weixin.qq.com/s?__biz=MzAwOTc2...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
021:为什么是卷积呢?
> 本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请查看[这里](https://mp.weixin.qq.com/s?__biz=MzAwOT...
0
评论
分享
董董灿是个攻城狮
AI算法攻城狮
·
8月前
关注
020:为什么 Resnet 如此重要?
> 本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请查看[这里](https://mp.weixin.qq.com/s?__biz=MzAwOT...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
749
文章被阅读
237,647
掘力值
7,266
关注了
2
关注者
365
收藏集
0
关注标签
8
加入于
2023-04-05