稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
dhnl的个人资料头像

dhnl

创作等级LV.2
掘友等级
掘友2级:见习掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1 沸点 0
赞
1
返回
|
搜索文章
dhnl的头像
dhnl
1年前

大模型原理理解-位置编码

旋转式位置编码(RoPE)最早是论文[1]提出的一种能够将相对位置信息依赖集成到 self-attention 中并提升 transformer 架构性能的位置编码方式。而...
0
评论
分享
dhnl的头像
dhnl
1年前

大模型原理理解-LLama 2 原理及源码解读

facebook 源码 https://github.com/facebookresearch/llama/blob/main/llama/model.py transfo...
image
0
评论
分享
dhnl的头像
dhnl
1年前
  • 举报
#新人报道#
分享
评论
点赞
dhnl
赞了这篇文章
旭伦的头像
旭伦
算法工程师
·
2年前

2023年的深度学习入门指南(20) - LLaMA 2模型解析

上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA的Transformer结构...
image
1
1
分享
dhnl的头像
dhnl
1年前

Trie 树

Trie 树是N 叉树,其一个重要性质是左节点小于根节点的值,右节点都大于根节点的值,如果处理浮点数的话,就可能导致整个 Trie 树巨长无比,节点可读性也非常差...
0
评论
分享
个人成就
文章被阅读 3,719
掘力值 53
关注了
0
关注者
0
收藏集
0
关注标签
5
加入于
2023-11-25