Page 59 - 《软件学报》2021年第8期
P. 59

软件学报 ISSN 1000-9825, CODEN RUXUEW                                       E-mail: jos@iscas.ac.cn
                 Journal of Software,2021,32(8):2341−2351 [doi: 10.13328/j.cnki.jos.006006]   http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                         Tel: +86-10-62562563


                                                                           ∗
                 国产异构系统上的 HPCG 并行算法及高效实现

                                                                           1
                                1,2
                                                                   4
                                                          1,3
                                        1,2
                                                 1,2
                 刘芳芳  1,2,3 ,   王志军 ,   汪   荃 ,   吴丽鑫 ,   马文静 ,   杨   超 ,   孙家昶
                 1
                 (中国科学院  软件研究所  并行软件与计算科学实验室,北京  100190)
                 2
                 (中国科学院大学,北京  100049)
                 3 (计算机科学国家重点实验室(中国科学院  软件研究所),北京  100190)
                 4 (北京大学  数学科学学院,北京 100871)
                 通讯作者:  马文静, E-mail: wenjing@iscas.ac.cn

                 摘   要: HPCG 基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大
                 规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行 HPCG 软件具
                 有非常重要的意义,其不仅可以提升国产超级计算机 HPCG 的排名,还对很多应用提供了并行算法、优化技术等方
                 面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对 HPCG 进行并行,并提出一种适
                 用于结构化网格的图着色算法.该算法并行性能高于传统的 JPL、CC 等算法,且着色质量高,运用于 HPCG 后,迭代
                 次数减少了 3 次,整体性能提升了 6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于 HPCG 的任务
                 划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外
                 区划分算法将核心函数 SpMV、SymGS 中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算
                 机峰值性能的 1.67%,与单节点相比,整机弱可扩展性并行效率达到了 92%.
                 关键词: HPCG;国产超级计算机;图着色;SpMV;SymGS
                 中图法分类号: TP303

                 中文引用格式:  刘芳芳,王志军,汪荃,吴丽鑫,马文静,杨超,孙家昶.国产异构系统上的 HPCG 并行算法及高效实现.软件学报,
                 2021,32(8):2341–2351. http://www.jos.org.cn/1000-9825/6006.htm
                 英文引用格式: Liu FF, Wang ZJ, Wang Q, Wu LX, Ma WJ, Yang C, Sun JC. Parallel algorithm and efficient implementation of
                 HPCG on domestic heterogeneous systems. Ruan Jian Xue Bao/Journal of Software, 2021,32(8):2341−2351 (in Chinese). http://www.
                 jos.org.cn/1000-9825/6006.htm
                 Parallel Algorithm  and  Efficient Implementation  of HPCG  on Domestic Heterogeneous
                 Systems
                                                                          1,2
                                              1,2
                                                             1,2
                                                                                         1,3
                                                                                                       4
                 LIU Fang-Fang 1,2,3 ,   WANG Zhi-Jun ,  WANG Quan ,   WU Li-Xin ,  MA  Wen-Jing ,   YANG Chao ,
                            1
                 SUN Jia-Chang
                 1 (Laboratory of Parallel Software  and Computational  Science, Institute  of Software, Chinese  Academy of Sciences,  Beijing 100190,
                  China)
                 2 (University of Chinese Academy of Sciences, Beijing 100049, China)
                 3 (State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
                 4 (School of Mathematical Sciences, Peking University, Beijing 100871, China)

                   ∗  基金项目:  中国科学院战略性先导科技专项(C 类)(XDC01030200);  国家重点研发计划(2018YFB0204404, 2016YFB0200603)
                     Foundation item: Strategic Priority Research Program of the Chinese Academy of Sciences (Category C) (XDC01030200); National
                 Key Research and Development Program of China (2018YFB0204404, 2016YFB0200603)
                      本文由“国产复杂异构高性能数值软件的研制与测试”专题特约编辑孙家昶研究员、李会元研究员推荐.
                      收稿时间: 2019-08-22;  修改时间: 2019-12-05;  定稿时间: 2020-01-22
   54   55   56   57   58   59   60   61   62   63   64