首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
b
订阅
许_辰
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
Cuda编程系列-Cuda编程基本概念&编程模型
在介绍编码相关内容之前,一个更重要的话题是什么类型的问题适合用GPU进行解决。 GPU于CPU相比,有着惊人的核数、运算单元及内存带宽。对于给定问题,如果有办法把它分解为多个独立的子问题并行解决,那么GPU很有可能提供比CPU更好的性能。所谓“独立”,指的是所分解的子问题满足:…
如何实现一个高效的Softmax CUDA kernel?
本文将会介绍OneFlow中优化的Softmax CUDA Kernel的技巧,并跟cuDNN中的Softmax操作进行实验对比,结果表明,OneFlow深度优化后的Softmax对显存带宽的利用率可
实时增量学习在云音乐直播推荐系统中的实践
云音乐直播推荐从实际业务背景出发,结合场景算法特色,分享如何从零到一搭建实时增量学习框架,并解决模型实时化过程中带来的OOV、局部pattern有偏、样本/特征不置信问题的实战经验。