AI - smile1sky的收藏集 - 掘金

AI

更多收藏集

6篇文章 · 0订阅

注意力机制：GPT等大模型的基石

## 1 啥是注意力？人类观察事物，能快速判断一种事物，是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断，而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践，产生了注意力机制

JavaEdge在掘金
1年前
191
1
评论

机器学习入门（二）—— 模型训练篇：监督学习

机器学习里常见算法：一些基本概念：模型（Model）：给定输入，输出预测。损失函数（Loss）：模型预测出来的结果，与真实的结果，怎么去计算他们的差别。其值越小，代表模型预测结果越接

齐舞647
1年前
1.3k
11
1

大模型应用之RAG详解

技术最初源于2020年Facebook的一篇论文——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。是的。

奇舞精选
1年前
2.5k
25
3

Deepseek系列论文解读1：从DeepSeek V3、DeepSeekMath到DeepSeek R1原理解读

最近开始读ds的论文，为了方便巩固知识，记录一下。总体来说，我想按照 DeepSeek V3 -> DeepSeekMath -> DeepSeek R1 路径来讲解

RaoChongzhi
1年前
1.4k
6
2

Tokens 是什么, 为什么大模型按Tokens 收费, 和API调用收费的区别

昨天老婆说公司用的一个AI大模型产品按照Tokens 收费,问我Tokens是什么? 嗯... 给老婆科普一下什么是 Tokens？在自然语言处理 (NLP) 和大语言模型（如 GPT 系列）中

麦客奥德彪
1年前
9.1k
76
22

DeepSeek 冲击（含本地化部署实践）

DeepSeek无疑是春节档最火爆的话题，上线不足一月，其全球累计下载量已达4000万，反超ChatGPT成为全球增长最快的AI应用，并且完全开源。那么究竟DeepSeek有什么魔力，能够让大家趋之若

京东零售技术
1年前
283
3
2