首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
推理优化
订阅
用户9271931437028
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
CUDA编程从放弃到入门
最近看fastertransformer源码,接触了很多底层到东西,cuda源码各种看不懂,就去学cuda,学了一会儿觉得就想放弃,结果翻回去看源码还是不懂,反复几次,最后干脆拿出一上午静静地把官方文档啃了啃才算入门。所以写这篇文章帮助同样想要放弃的同学入门一下。 网上关于cu…
CUDA 矩阵乘法终极优化指南
单精度矩阵乘法几乎是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧。本文将详细介绍 CUDA SGEMM 的优化手段。
【DL】浅谈模型Inference优化
最近又被一周一更的flag打脸,一是拉来了外援助阵专栏(以后会越来越多的!),二是自己想探索新的故事线(比如NLP+CV的任务),三是工作太忙(懒)。 1. 简介 重写Kernel(GPU):使用GPU计算时,每次运算(比如TF中的operation)都要经过几个流程:CPU在…