【Triton 教程】triton_language.make_block_ptr

27 阅读1分钟

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN计算内核,并能够在现代 GPU硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

返回指向父张量中 1 个块的指针。

参数**:**

  • base - 父张量的基础指针。
  • shape - 父张量的形状。
  • strides - 父张量的步幅。
  • offsets - 块的偏移量。
  • block_shape - 块的形状。
  • order - 原始数据格式的顺序。