Page 91 - 《软件学报》2024年第6期
P. 91
方燕飞 等: 申威众核处理器访存与通信融合编译优化 2667
cn/1000-9825/5197.htm [doi: 10.13328/j.cnki.jos.005197]
[13] Liu Y, Liu L, He WQ. A static data placement optimisation model oriented towards multi-core hierarchical accessible resources.
Computer Applications and Software, 2011, 28(7): 53–56 (in Chinese with English abstract). [doi: 10.3969/j.issn.1000-386X.2011.07.016]
[14] Wu MC, Liu Y, Cui HM, Wei QF, Li QF, Li LM, Lv F, Xue JL, Feng XB. Bandwidth-aware loop tiling for DMA-supported scratchpad
memory. In: Proc. of the 2020 ACM Int’l Conf. on Parallel Architectures and Compilation Techniques. New York: ACM, 2020. 97–109.
[doi: 10.1145/3410463.3414637]
[15] Wu MC, Liu Y, Li LM, Feng XB. An inter-CG collaborative OpenCL compilation method on the Sunway TaihuLight supercomputer.
Chinese High Technology Letters, 2022, 32(9): 927–936 (in Chinese with English abstract). [doi: 10.3772/j.issn.1002-0470.2022.09.006]
[16] Zhou B, Huang YZ, Xu JC, Guo SZ, Qi HY. Memory latency optimizations for the elementary functions on the Sunway architecture. The
Journal of Supercomputing, 2019, 75(7): 3917–3944. [doi: 10.1007/s11227-018-02741-1]
[17] Jiang YQ. Research on parallel optimization of transformer model based on the new generation of Sunway many-core processors [MS.
Thesis]. Shanghai: East China Normal University, 2022 (in Chinese with English abstract). [doi: 10.27149/d.cnki.ghdsu.2022.002946]
附中文参考文献:
[5] 方燕飞, 刘齐, 董恩铭, 李雁冰, 过锋, 王谛, 何王全, 漆锋滨. 面向 E 级超算系统的众核片上存储层次研究. 计算机工程, 2023,
董恩铭(1988-), 男, 博士, 助理研究员, 主要研
49(12): 10–24. [doi: 10.19678/j.issn.1000-3428.0066548]
[6] 高剑刚, 刘鑫, 李芳, 刘勇, 彭达佳, 陈鑫, 陈德训. 面向神威众核超算系统的并行计算模型研究. 计算机学报, 2023, 46(7): 1339–1349.
[doi: 10.11897/SP.J.1016.2023.01339]
[10] 李建江, 刘珍珍, 王珏. 基于 IBM Cell 多核平台的 OpenMP 数组私有化技术研究. 计算机研究与发展, 2010, 47(8): 1434–1441.
[12] 何王全, 刘勇, 方燕飞, 魏迪, 漆锋滨. 面向国产异构众核系统的 Parallel C 语言设计与实现. 软件学报, 2017, 28(4): 764–785. http://
www.jos.org.cn/1000-9825/5197.htm [doi: 10.13328/j.cnki.jos.005197]
[13] 刘 勇 , 刘 丽 , 何 王 全 . 面 向 众 核 多 级 访 存 资 源 的 静 态 数 据 布 局 优 化 模 型 . 计 算 机 应 用 与 软 件 , 2011, 28(7): 53–56. [doi:
10.3969/j.issn.1000-386X.2011.07.016]
[15] 伍明川, 刘颖, 李立民, 冯晓兵. 面向神威·太湖之光的多核组协同的 OpenCL 编译方法. 高技术通讯, 2022, 32(9): 927–936. [doi:
10.3772/j.issn.1002-0470.2022.09.006]
[17] 姜云桥. 基于新一代申威众核处理器的 Transformer 模型并行优化的研究 [硕士学位论文]. 上海: 华东师范大学, 2022. [doi: 10.27149/
d.cnki.ghdsu.2022.002946]
方燕飞(1980-), 女, 高级工程师, 主要研究领域 王云飞(1995-), 男, 硕士, 主要研究领域为软件
为并行语言, 编译优化. 工程.
李雁冰(1989-), 男, 博士, 助理研究员, 主要研 刘齐(1992-), 男, 助理研究员, 主要研究领域为
究领域为并行编译. 并行语言, 编译优化.
究领域为高性能计算软件.