首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
深度学习
订阅
雪落花开
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
何谓 DeepSeek “蒸馏”?
可以说 DeepSeek通过“大模型强化学习+小模型蒸馏”的技术路径,不仅能与OpenAI的正面竞争,更提供了一个新的大模型研发思路。本篇一起来深入了解一下:何谓 DeepSeek “蒸馏”?
从启发式到模型化,京东推荐广告排序机制演化
探讨京东推荐广告场景下的流量排序拍卖机制设计问题,讲述了京东排序拍卖机制的关键技术突破点以及技术演化路线,通过本文可以了解京东推荐广告排序机制在流量价值预估、用户兴趣探索以及模型化拍卖等方面
深入理解Transformer技术原理 | 得物技术
谷歌在2017年发布Transformer架构的论文时,论文的标题是:Attention Is All You Need。重点说明了这个架构是基于注意力机制的。