Page 493 - 《软件学报》2025年第8期
P. 493

3916                                                       软件学报  2025  年第  36  卷第  8  期


                     In: Proc. of the 15th ACM Int’l Conf. on Computing Frontiers. Ischia: ACM, 2018. 26–35. [doi: 10.1145/3203217.3203244]
                 [22]  Sergeev A, Del Balso M. Horovod: Fast and easy distributed deep learning in TensorFlow. arXiv:1802.05799, 2018.

                 附中文参考文献:
                  [5]  田卓, 陈一峯. 神威太湖之光上分子动力学模拟的性能优化. 软件学报, 2021, 32(9): 2945–2962. http://www.jos.org.cn/1000-9825/
                     5978.htm [doi: 10.13328/j.cnki.jos.005978]
                  [6]  洪文杰, 李肯立, 全哲, 阳王东, 李克勤, 郝子宇, 谢向辉. 面向神威·太湖之光的     PETSc 可扩展异构并行算法及其性能优化. 计算机
                     学报, 2017, 40(9): 2057–2069. [doi: 10.11897/SP.J.1016.2017.02057]
                  [9]  王占立. 面向  GPDSP  科学计算的高性能  DMA  传输方式的设计与实现 [硕士学位论文]. 长沙: 国防科技大学, 2015.
                 [10]  龚春叶, 刘杰, 包为民, 潘冬梅, 甘新标, 李胜国, 陈旭光, 肖调杰, 杨博, 王睿伯. 后摩尔时代国产高性能并行应用软件生态建设综述.
                     系统仿真学报, 2022, 34(10): 2107–2118. [doi: 10.16182/j.issn1004731x.joss.21-1365]
                 [13]  李亿渊, 薛巍, 陈德训, 王欣亮, 许平, 张武生, 杨广文. 稀疏矩阵向量乘法在申威众核架构上的性能优化. 计算机学报, 2020, 43(6):
                     1010–1024. [doi: 10.11897/SP.J.1016.2020.01010]
                 [15]  裴向东, 王庆林, 廖林玉, 李荣春, 梅松竹, 刘杰, 庞征斌. 多核数字信号处理器并行矩阵转置算法优化. 国防科技大学学报, 2023,
                     45(1): 57–66. [doi: 10.11887/j.cn.202301006]
                 [16]  王庆林, 李东升, 梅松竹, 赖志权, 窦勇. 面向飞腾多核处理器的       Winograd  快速卷积算法优化. 计算机研究与发展, 2020, 57(6):
                     1140–1151. [doi: 10.7544/issn1000-1239.2020.20200107]
                 [19]  陈锐, 孙羽菲, 程大果, 郭强, 陈禹乔, 石昌青, 隋轶丞, 张宇哲, 张玉志. TensorFlow  中  OpenCL  核函数的实现与优化. 计算机学报,
                     2022, 45(11): 2456–2474. [doi: 10.11897/SP.J.1016.2022.02456]


                             王昊天(2000-), 男, 博士生, 主要研究领域为异                 石昌青(1997-), 男, 博士生, CCF  学生会员, 主
                            构计算, 高性能计算, 自然语言处理.                          要研究领域为深度学习, 异构计算, 高性能计算.




                             孙羽菲(1976-), 女, 博士, 特聘研究员, 主要研                方建滨(1984-), 男, 博士, 助理研究员, CCF  杰
                            究领域为深度学习, 异构计算, 人工智能.                        出会员, 主要研究领域为多核并行编程, 并行编
                                                                         译器, 性能建模, 可扩展算法.



                             隋轶丞(1998-), 男, 博士生, 主要研究领域为高                 张玉志(1964-), 男, 博士, 教授, 博士生导师,
                            性能计算, 深度学习算法.                                CCF  专业会员, 主要研究领域为人工智能, 模式
                                                                         识别, 自然语言处理.



                             王嘉豪(2000-), 男, 硕士生, 主要研究领域为深
                            度学习, 高性能计算.
   488   489   490   491   492   493   494