首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
dhnl
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
dhnl
1年前
关注
大模型原理理解-位置编码
旋转式位置编码(RoPE)最早是论文[1]提出的一种能够将相对位置信息依赖集成到 self-attention 中并提升 transformer 架构性能的位置编码方式。而...
0
评论
分享
dhnl
1年前
关注
大模型原理理解-LLama 2 原理及源码解读
facebook 源码 https://github.com/facebookresearch/llama/blob/main/llama/model.py transfo...
0
评论
分享
dhnl
1年前
举报
#新人报道#
分享
评论
点赞
dhnl
赞了这篇文章
旭伦
算法工程师
·
2年前
关注
2023年的深度学习入门指南(20) - LLaMA 2模型解析
上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA的Transformer结构...
1
1
分享
dhnl
1年前
关注
Trie 树
Trie 树是N 叉树,其一个重要性质是左节点小于根节点的值,右节点都大于根节点的值,如果处理浮点数的话,就可能导致整个 Trie 树巨长无比,节点可读性也非常差...
0
评论
分享
个人成就
文章被阅读
3,719
掘力值
53
关注了
0
关注者
0
收藏集
0
关注标签
5
加入于
2023-11-25