Page 493 - 《软件学报》2025年第8期
P. 493
3916 软件学报 2025 年第 36 卷第 8 期
In: Proc. of the 15th ACM Int’l Conf. on Computing Frontiers. Ischia: ACM, 2018. 26–35. [doi: 10.1145/3203217.3203244]
[22] Sergeev A, Del Balso M. Horovod: Fast and easy distributed deep learning in TensorFlow. arXiv:1802.05799, 2018.
附中文参考文献:
[5] 田卓, 陈一峯. 神威太湖之光上分子动力学模拟的性能优化. 软件学报, 2021, 32(9): 2945–2962. http://www.jos.org.cn/1000-9825/
5978.htm [doi: 10.13328/j.cnki.jos.005978]
[6] 洪文杰, 李肯立, 全哲, 阳王东, 李克勤, 郝子宇, 谢向辉. 面向神威·太湖之光的 PETSc 可扩展异构并行算法及其性能优化. 计算机
学报, 2017, 40(9): 2057–2069. [doi: 10.11897/SP.J.1016.2017.02057]
[9] 王占立. 面向 GPDSP 科学计算的高性能 DMA 传输方式的设计与实现 [硕士学位论文]. 长沙: 国防科技大学, 2015.
[10] 龚春叶, 刘杰, 包为民, 潘冬梅, 甘新标, 李胜国, 陈旭光, 肖调杰, 杨博, 王睿伯. 后摩尔时代国产高性能并行应用软件生态建设综述.
系统仿真学报, 2022, 34(10): 2107–2118. [doi: 10.16182/j.issn1004731x.joss.21-1365]
[13] 李亿渊, 薛巍, 陈德训, 王欣亮, 许平, 张武生, 杨广文. 稀疏矩阵向量乘法在申威众核架构上的性能优化. 计算机学报, 2020, 43(6):
1010–1024. [doi: 10.11897/SP.J.1016.2020.01010]
[15] 裴向东, 王庆林, 廖林玉, 李荣春, 梅松竹, 刘杰, 庞征斌. 多核数字信号处理器并行矩阵转置算法优化. 国防科技大学学报, 2023,
45(1): 57–66. [doi: 10.11887/j.cn.202301006]
[16] 王庆林, 李东升, 梅松竹, 赖志权, 窦勇. 面向飞腾多核处理器的 Winograd 快速卷积算法优化. 计算机研究与发展, 2020, 57(6):
1140–1151. [doi: 10.7544/issn1000-1239.2020.20200107]
[19] 陈锐, 孙羽菲, 程大果, 郭强, 陈禹乔, 石昌青, 隋轶丞, 张宇哲, 张玉志. TensorFlow 中 OpenCL 核函数的实现与优化. 计算机学报,
2022, 45(11): 2456–2474. [doi: 10.11897/SP.J.1016.2022.02456]
王昊天(2000-), 男, 博士生, 主要研究领域为异 石昌青(1997-), 男, 博士生, CCF 学生会员, 主
构计算, 高性能计算, 自然语言处理. 要研究领域为深度学习, 异构计算, 高性能计算.
孙羽菲(1976-), 女, 博士, 特聘研究员, 主要研 方建滨(1984-), 男, 博士, 助理研究员, CCF 杰
究领域为深度学习, 异构计算, 人工智能. 出会员, 主要研究领域为多核并行编程, 并行编
译器, 性能建模, 可扩展算法.
隋轶丞(1998-), 男, 博士生, 主要研究领域为高 张玉志(1964-), 男, 博士, 教授, 博士生导师,
性能计算, 深度学习算法. CCF 专业会员, 主要研究领域为人工智能, 模式
识别, 自然语言处理.
王嘉豪(2000-), 男, 硕士生, 主要研究领域为深
度学习, 高性能计算.

