CUDA - 恣肆的收藏集 - 掘金

CUDA

更多收藏集

4篇文章 · 0订阅

极智开发 | GPU CUDA 使用 memory padding 避免 bank conflict

欢迎关注我的公众号 [极智视界]，回复001获取Google编程规范。本文聊一下如何在 GPU CUDA 编程里使用 memory padding 来避免 bank conflict。

极智视界
4年前
2.9k
4
评论

极智开发 | GPU CUDA 使用 memory padding 避免 bank conflict

Pytorch和CUDA联合编程的基本步骤

目前PyTorch已经提供了丰富的接口可以直接调用，但是仍存在一些高度自定义的操作无法使用PyToch或者Python高效

twn29004
4年前
3.8k
3
评论

TensorRT 开始

TensorRT 是 NVIDIA 自家的高性能推理库，本文将一步步介绍其从安装，直到加速推理自己的 ONNX 模型。

GoCoding
4年前
3.6k
3
评论

如何实现一个高效的Softmax CUDA kernel？

本文将会介绍OneFlow中优化的Softmax CUDA Kernel的技巧，并跟cuDNN中的Softmax操作进行实验对比，结果表明，OneFlow深度优化后的Softmax对显存带宽的利用率可

OneFlow一流科技
4年前
2.5k
6
评论

如何实现一个高效的Softmax CUDA kernel？