Page 59 - 《软件学报》2021年第8期
P. 59
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2021,32(8):2341−2351 [doi: 10.13328/j.cnki.jos.006006] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
∗
国产异构系统上的 HPCG 并行算法及高效实现
1
1,2
4
1,3
1,2
1,2
刘芳芳 1,2,3 , 王志军 , 汪 荃 , 吴丽鑫 , 马文静 , 杨 超 , 孙家昶
1
(中国科学院 软件研究所 并行软件与计算科学实验室,北京 100190)
2
(中国科学院大学,北京 100049)
3 (计算机科学国家重点实验室(中国科学院 软件研究所),北京 100190)
4 (北京大学 数学科学学院,北京 100871)
通讯作者: 马文静, E-mail: wenjing@iscas.ac.cn
摘 要: HPCG 基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大
规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行 HPCG 软件具
有非常重要的意义,其不仅可以提升国产超级计算机 HPCG 的排名,还对很多应用提供了并行算法、优化技术等方
面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对 HPCG 进行并行,并提出一种适
用于结构化网格的图着色算法.该算法并行性能高于传统的 JPL、CC 等算法,且着色质量高,运用于 HPCG 后,迭代
次数减少了 3 次,整体性能提升了 6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于 HPCG 的任务
划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外
区划分算法将核心函数 SpMV、SymGS 中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算
机峰值性能的 1.67%,与单节点相比,整机弱可扩展性并行效率达到了 92%.
关键词: HPCG;国产超级计算机;图着色;SpMV;SymGS
中图法分类号: TP303
中文引用格式: 刘芳芳,王志军,汪荃,吴丽鑫,马文静,杨超,孙家昶.国产异构系统上的 HPCG 并行算法及高效实现.软件学报,
2021,32(8):2341–2351. http://www.jos.org.cn/1000-9825/6006.htm
英文引用格式: Liu FF, Wang ZJ, Wang Q, Wu LX, Ma WJ, Yang C, Sun JC. Parallel algorithm and efficient implementation of
HPCG on domestic heterogeneous systems. Ruan Jian Xue Bao/Journal of Software, 2021,32(8):2341−2351 (in Chinese). http://www.
jos.org.cn/1000-9825/6006.htm
Parallel Algorithm and Efficient Implementation of HPCG on Domestic Heterogeneous
Systems
1,2
1,2
1,2
1,3
4
LIU Fang-Fang 1,2,3 , WANG Zhi-Jun , WANG Quan , WU Li-Xin , MA Wen-Jing , YANG Chao ,
1
SUN Jia-Chang
1 (Laboratory of Parallel Software and Computational Science, Institute of Software, Chinese Academy of Sciences, Beijing 100190,
China)
2 (University of Chinese Academy of Sciences, Beijing 100049, China)
3 (State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
4 (School of Mathematical Sciences, Peking University, Beijing 100871, China)
∗ 基金项目: 中国科学院战略性先导科技专项(C 类)(XDC01030200); 国家重点研发计划(2018YFB0204404, 2016YFB0200603)
Foundation item: Strategic Priority Research Program of the Chinese Academy of Sciences (Category C) (XDC01030200); National
Key Research and Development Program of China (2018YFB0204404, 2016YFB0200603)
本文由“国产复杂异构高性能数值软件的研制与测试”专题特约编辑孙家昶研究员、李会元研究员推荐.
收稿时间: 2019-08-22; 修改时间: 2019-12-05; 定稿时间: 2020-01-22