首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
LogicOverlord
掘友等级
AI infra开发工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
LogicOverlord
AI infra开发工程师
·
2年前
关注
C++ 对函数的引用
优势:指针可以为空或无效。引用保证它有效且不为空(不存在空引用) 例:```cpp #include <iostream> using namespace std; voi...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
cuda全局内存高效访问——对齐访问和合并内存访问
高效的全局内存访问需要保证一点: 相邻的线程访问相邻的数据。(This is oversimple, but the correct way to do it is jus...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
(转载)vscode-server离线安装
原创:https://blog.csdn.net/qq_28753373/article/details/123007214 获取当前版本vscode的commit_id:...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
pytorch中算子注册原理
注:新手文章,欢迎指正!以下内容基于pytorch2.0.0 pytorch的官方教程https://pytorch.org/tutorials/advanced/exte...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
nvcc和gcc联合编程
示例一: 示例二: 示例三: 参考资料: https://stackoverflow.com/questions/9421108/how-can-i-compile-cud...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
cuda编程中cudaMallocPitch和cudaMemcpy2D的用法
cuda编程分别device端内存的时候,最常用的是cudaMalloc、cudaMemcpy()和cudaFree()函数,本文讲解如何使用这两个函数。...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
cuda编程中block size和grid size选择以及占用率计算
cuda编程中block size和grid size选择,如何理论计算cuda占用率,考虑三个因素,最终利用木桶效应得出结论。...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
(转载)GPU资源占用与利用率
来源:https://zhuanlan.zhihu.com/p/353410111 SM上的内存资源是有限的,如果每个线程占用的内存资源过多则一个SM上同时可执行的线程数就...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
(转载)如何设置 CUDA Kernel 中的 grid_size 和 block_size?
来源:https://my.oschina.net/oneflow/blog/5348639 撰文 | 柳俊...
0
评论
分享
LogicOverlord
AI infra开发工程师
·
2年前
关注
setup.py中cmd_class的用法以及pytorch的build_ext
python中setup.py的用法,如果构建cmdclass,pytorch的extension机制...
0
评论
分享
个人成就
文章被点赞
5
文章被阅读
15,668
掘力值
432
关注了
0
关注者
6
收藏集
0
关注标签
0
加入于
2023-07-06