首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
b
订阅
许_辰
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
Cuda编程系列-Cuda编程基本概念&编程模型
在介绍编码相关内容之前,一个更重要的话题是什么类型的问题适合用GPU进行解决。 GPU于CPU相比,有着惊人的核数、运算单元及内存带宽。对于给定问题,如果有办法把它分解为多个独立的子问题并行解决,那么GPU很有可能提供比CPU更好的性能。所谓“独立”,指的是所分解的子问题满足:…
如何实现一个高效的Softmax CUDA kernel?
本文将会介绍OneFlow中优化的Softmax CUDA Kernel的技巧,并跟cuDNN中的Softmax操作进行实验对比,结果表明,OneFlow深度优化后的Softmax对显存带宽的利用率可
实时增量学习在云音乐直播推荐系统中的实践
云音乐直播推荐从实际业务背景出发,结合场景算法特色,分享如何从零到一搭建实时增量学习框架,并解决模型实时化过程中带来的OOV、局部pattern有偏、样本/特征不置信问题的实战经验。