稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
b
订阅
avatar
许_辰
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • Cuda编程系列-Cuda编程基本概念&编程模型
    在介绍编码相关内容之前,一个更重要的话题是什么类型的问题适合用GPU进行解决。 GPU于CPU相比,有着惊人的核数、运算单元及内存带宽。对于给定问题,如果有办法把它分解为多个独立的子问题并行解决,那么GPU很有可能提供比CPU更好的性能。所谓“独立”,指的是所分解的子问题满足:…
    • zwood
    • 6年前
    • 2.8k
    • 4
    • 1
    编程语言
    Cuda编程系列-Cuda编程基本概念&编程模型
  • 如何实现一个高效的Softmax CUDA kernel?
    本文将会介绍OneFlow中优化的Softmax CUDA Kernel的技巧,并跟cuDNN中的Softmax操作进行实验对比,结果表明,OneFlow深度优化后的Softmax对显存带宽的利用率可
    • OneFlow一流科技
    • 3年前
    • 2.4k
    • 6
    • 评论
    GPU
    如何实现一个高效的Softmax CUDA kernel?
  • 实时增量学习在云音乐直播推荐系统中的实践
    云音乐直播推荐从实际业务背景出发,结合场景算法特色,分享如何从零到一搭建实时增量学习框架,并解决模型实时化过程中带来的OOV、局部pattern有偏、样本/特征不置信问题的实战经验。
    • 网易云音乐技术团队
    • 3年前
    • 3.9k
    • 13
    • 评论
    算法 人工智能
    实时增量学习在云音乐直播推荐系统中的实践