Intel Parallel Studio XE Cluster Edition 2020 Update 4 Linux 安装测试

29 阅读2分钟

准备安装包

image.png

解压进入运行安装

image.png

运行install.sh

安装过程

第一个enter,读他的各种条款,最后accept

收集个人信息

image.png 当然是NO了!

前置条件检测

image.png 按照提示安装缺失的包

按照指示安装

image.png

image.png 这里选择用license文件离线激活,我已经激活过了

image.png

image.png 自定义安装

image.png 先输入1取消勾选,然后3完成

image.png

选3自定义组件 image.png 输入a后再输入a可以全部取消勾选,然后勾选如图所示组件

image.png 不需要32位库直接安装

环境变量

在 /etc/profile.d/ 下,创建一个自定义sh,例如intel_compiler.sh,写上自己的路径

source /share/intel/parallel_studio_xe_2020.4.912/bin/psxevars.sh intel64

然后logout,再重新登陆即可

跑个分linpack

image.png

配置HPL.dat

Ns值

网上大多数都说N的值为N×N×8=系统总内存×80%最优

N^2 * 8 = 系统总内存(字节) * 80%

如果用GB需要乘2^30

image.png

image.png

用-b可直接显示字节数,N^2 = 3953971200 * 0.1。N = 19,884

多节点内存乘上节点数

NBs

最佳实践值,试出来的,默认192 256 两个值,可测多个值,看你处理器性能咯

资料:块大小(NB)对于计算性能有重要影响,因为它决定了数据在处理器缓存中是如何组织的,以及如何在计算节点之间传输。一个合适的块大小可以减少通信开销,并且能有效地利用处理器的缓存系统。

image.png

Ps Qs

我虚拟机分配的2核2线程

image.png plaintext

1            # of process grids (P x Q)
2            Ps
2            Qs

内存性能测试

image.png

www.cs.virginia.edu/stream/FTP/…

gcc -mtune=native -march=native -O3 -mcmodel=medium -fopenmp -DSTREAM__ARRAY__SIZE=2400000000 -DNTIMES=20 stream.c -o stream

export OMP_NUM_THREADS=2

文件系统

image.png

Iozone Filesystem Benchmark Download Source: Latest tarball

image.png

image.png