稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
AI
订阅
avatar
chibs
更多收藏集

微信扫码分享

微信
新浪微博
QQ

1篇文章 · 0订阅
  • 阅读pytorch源码准备
    WITH_NCCL: 单机上多GPU通信,支持MPI编程。单PCIe上性能最好,虽然多PCIe也可运行。 CUBLAS/Thrust:这个是CUDA的BLAS部分会用到。这个文档直接读NVIDIA官方的就好了 这个部分是PyTorch里最底层的部分,但是也是我觉得写的最好的部分…
    • ckproc
    • 5年前
    • 2.4k
    • 1
    • 评论
    人工智能