Page 335 - 《软件学报》2021年第9期
P. 335
田卓 等:神威太湖之光上分子动力学模拟的性能优化 2959
同时,我们还测试了在不同系统规模下,程序总耗时的变化,如图 27 所示.在图 27 的折线图中,标出了每个进
程点所对应的粒子个数,可观察到时间的变化.
Time
4.0
16777216
3.5
11239424
3.0
Time(s) 2.5 7077888
2.0
4096000
2097152
1.5
884736
262144
1.0 32768
4096
0.5
0 20000 40000 60000 80000 100000 120000 140000
进程数
Fig.27 Time changes with different scales
图 27 不同系统规模下时间的变化
我们的目标是提高通信受限类程序的迭代频率,为了比较系统的实际性能,我们采用的度量公式如下:
performance=natoms×nsteps/sec.
在不同的系统规模下,对应的粒子个数也不同,综合对比系统性能.如图 28 所示,系统性能随着进程数的增
加而稳步提升.
性能
100
80
60
性能 40
20
0
0 20000 40000 60000 80000 100000 120000 140000
进程数
Fig.28 Performance with different system sizes
图 28 不同系统规模下的性能
由表 4 可知,本文给出的优化策略高于其他软件解决方案.当原子个数小于 10million 时,迭代速度大于
10Ksteps/s,该迭代速度高于现有的绝大部分软件解决方案.同时,较 Anton 硬件解决方案的优势是它的可扩展