准备安装包
解压进入运行安装
运行install.sh
安装过程
第一个enter,读他的各种条款,最后accept
收集个人信息
当然是NO了!
前置条件检测
按照提示安装缺失的包
按照指示安装
这里选择用license文件离线激活,我已经激活过了
自定义安装
先输入1取消勾选,然后3完成
选3自定义组件
输入a后再输入a可以全部取消勾选,然后勾选如图所示组件
不需要32位库直接安装
环境变量
在 /etc/profile.d/ 下,创建一个自定义sh,例如intel_compiler.sh,写上自己的路径
source /share/intel/parallel_studio_xe_2020.4.912/bin/psxevars.sh intel64
然后logout,再重新登陆即可
跑个分linpack
配置HPL.dat
Ns值
网上大多数都说N的值为N×N×8=系统总内存×80%最优
N^2 * 8 = 系统总内存(字节) * 80%
如果用GB需要乘2^30
用-b可直接显示字节数,N^2 = 3953971200 * 0.1。N = 19,884
多节点内存乘上节点数
NBs
最佳实践值,试出来的,默认192 256 两个值,可测多个值,看你处理器性能咯
资料:块大小(NB)对于计算性能有重要影响,因为它决定了数据在处理器缓存中是如何组织的,以及如何在计算节点之间传输。一个合适的块大小可以减少通信开销,并且能有效地利用处理器的缓存系统。
Ps Qs
我虚拟机分配的2核2线程
plaintext
1 # of process grids (P x Q)
2 Ps
2 Qs
内存性能测试
www.cs.virginia.edu/stream/FTP/…
gcc -mtune=native -march=native -O3 -mcmodel=medium -fopenmp -DSTREAM__ARRAY__SIZE=2400000000 -DNTIMES=20 stream.c -o stream
export OMP_NUM_THREADS=2
文件系统
Iozone Filesystem Benchmark Download Source: Latest tarball