【Triton 教程】triton_language.swizzle2d

21 阅读1分钟

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

*在线运行 Triton 学习教程

链接是:hyper.ai/notebooks/3…

triton.language.swizzle2d(i, j, size_i, size_j, size_g)

将行主序的 size_i size_j 矩阵的索引转换为每组 size_g* 行的列主序矩阵的索引。

例如, 对 size_i = size_j = 4 和 size_g = 2,它将转换

 [[0 , 1 , 2 , 3 ],
 [4 , 5 , 6 , 7 ],
 [8 , 9 , 10, 11],
 [12, 13, 14, 15]]

[[0, 2,  4 , 6 ],
 [1, 3,  5 , 7 ],
 [8, 10, 12, 14],
 [9, 11, 13, 15]]