首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
AI
订阅
smile1sky
更多收藏集
微信扫码分享
微信
新浪微博
QQ
6篇文章 · 0订阅
注意力机制:GPT等大模型的基石
## 1 啥是注意力? 人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制
机器学习入门(二)—— 模型训练篇:监督学习
机器学习里常见算法: 一些基本概念: 模型(Model): 给定输入,输出预测。 损失函数(Loss): 模型预测出来的结果,与真实的结果,怎么去计算他们的差别。 其值越小,代表模型预测结果越接
大模型应用之RAG详解
技术最初源于2020年Facebook的一篇论文——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。是的。
Deepseek系列论文解读1:从DeepSeek V3、DeepSeekMath到DeepSeek R1原理解读
最近开始读ds的论文,为了方便巩固知识,记录一下。 总体来说,我想按照 DeepSeek V3 -> DeepSeekMath -> DeepSeek R1 路径来讲解
Tokens 是什么, 为什么大模型按Tokens 收费, 和API调用收费的区别
昨天老婆说公司用的一个AI大模型产品 按照Tokens 收费,问我Tokens是什么? 嗯... 给老婆科普一下 什么是 Tokens? 在自然语言处理 (NLP) 和大语言模型(如 GPT 系列)中
DeepSeek 冲击(含本地化部署实践)
DeepSeek无疑是春节档最火爆的话题,上线不足一月,其全球累计下载量已达4000万,反超ChatGPT成为全球增长最快的AI应用,并且完全开源。那么究竟DeepSeek有什么魔力,能够让大家趋之若