稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
LogicOverlord的个人资料头像

LogicOverlord

创作等级LV.3
掘友等级
掘友4级:进阶掘友
AI infra开发工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2 沸点 0
赞
2
返回
|
搜索文章
赞
文章( 2 ) 沸点( 0 )
  • cuda编程中的共享内存(shared memory)
    共享内存位于GPU的SM中,由一个线程块(thread block)中的线程共同使用。共享内存的延迟比全局内存(global memory)低20到30倍,带宽高约10倍。如《Professional
    • LogicOverlord
    • 2年前
    • 1.4k
    • 2
    • 评论
    人工智能
  • 大模型推理优化技术-KV Cache
    近两年大模型火出天际;同时,也诞生了大量针对大模型的优化技术。本系列将针对一些常见大模型优化技术进行讲解。
    • 吃果冻不吐果冻皮
    • 1年前
    • 11k
    • 15
    • 3
    LLM
  • 个人成就
    文章被点赞 5
    文章被阅读 15,668
    掘力值 432
    关注了
    0
    关注者
    6
    收藏集
    0
    关注标签
    0
    加入于
    2023-07-06