Page 335 - 《软件学报》2021年第9期
P. 335

田卓  等:神威太湖之光上分子动力学模拟的性能优化                                                        2959


             同时,我们还测试了在不同系统规模下,程序总耗时的变化,如图 27 所示.在图 27 的折线图中,标出了每个进
         程点所对应的粒子个数,可观察到时间的变化.
                                                                          Time

                               4.0
                                                                        16777216
                               3.5
                                                            11239424
                               3.0

                              Time(s)  2.5        7077888
                               2.0
                                            4096000
                                       2097152
                               1.5
                                     884736
                                    262144
                               1.0  32768
                                  4096
                               0.5
                                  0   20000  40000  60000  80000  100000  120000  140000
                                                     进程数
                                     Fig.27    Time changes with different scales
                                       图 27   不同系统规模下时间的变化

             我们的目标是提高通信受限类程序的迭代频率,为了比较系统的实际性能,我们采用的度量公式如下:
                                        performance=natoms×nsteps/sec.
             在不同的系统规模下,对应的粒子个数也不同,综合对比系统性能.如图 28 所示,系统性能随着进程数的增
         加而稳步提升.
                                                                          性能
                               100


                                80

                                60

                              性能  40


                                20


                                 0

                                  0   20000  40000  60000  80000  100000  120000  140000
                                                     进程数
                                   Fig.28    Performance with different system sizes
                                         图 28   不同系统规模下的性能

             由表 4 可知,本文给出的优化策略高于其他软件解决方案.当原子个数小于 10million 时,迭代速度大于
         10Ksteps/s,该迭代速度高于现有的绝大部分软件解决方案.同时,较 Anton 硬件解决方案的优势是它的可扩展
   330   331   332   333   334   335   336   337   338   339   340