Page 91 - 《软件学报》2024年第6期
P. 91

方燕飞 等: 申威众核处理器访存与通信融合编译优化                                                       2667


                     cn/1000-9825/5197.htm [doi: 10.13328/j.cnki.jos.005197]
                 [13]  Liu  Y,  Liu  L,  He  WQ.  A  static  data  placement  optimisation  model  oriented  towards  multi-core  hierarchical  accessible  resources.
                     Computer Applications and Software, 2011, 28(7): 53–56 (in Chinese with English abstract). [doi: 10.3969/j.issn.1000-386X.2011.07.016]
                 [14]  Wu MC, Liu Y, Cui HM, Wei QF, Li QF, Li LM, Lv F, Xue JL, Feng XB. Bandwidth-aware loop tiling for DMA-supported scratchpad
                     memory. In: Proc. of the 2020 ACM Int’l Conf. on Parallel Architectures and Compilation Techniques. New York: ACM, 2020. 97–109.
                     [doi: 10.1145/3410463.3414637]
                 [15]  Wu MC, Liu Y, Li LM, Feng XB. An inter-CG collaborative OpenCL compilation method on the Sunway TaihuLight supercomputer.
                     Chinese High Technology Letters, 2022, 32(9): 927–936 (in Chinese with English abstract). [doi: 10.3772/j.issn.1002-0470.2022.09.006]
                 [16]  Zhou B, Huang YZ, Xu JC, Guo SZ, Qi HY. Memory latency optimizations for the elementary functions on the Sunway architecture. The
                     Journal of Supercomputing, 2019, 75(7): 3917–3944. [doi: 10.1007/s11227-018-02741-1]
                 [17]  Jiang YQ. Research on parallel optimization of transformer model based on the new generation of Sunway many-core processors [MS.
                     Thesis]. Shanghai: East China Normal University, 2022 (in Chinese with English abstract). [doi: 10.27149/d.cnki.ghdsu.2022.002946]

                 附中文参考文献:
                  [5]  方燕飞, 刘齐, 董恩铭, 李雁冰, 过锋, 王谛, 何王全, 漆锋滨. 面向   E  级超算系统的众核片上存储层次研究. 计算机工程, 2023,
                             董恩铭(1988-), 男, 博士, 助理研究员, 主要研
                     49(12): 10–24. [doi: 10.19678/j.issn.1000-3428.0066548]
                  [6]  高剑刚, 刘鑫, 李芳, 刘勇, 彭达佳, 陈鑫, 陈德训. 面向神威众核超算系统的并行计算模型研究. 计算机学报, 2023, 46(7): 1339–1349.
                     [doi: 10.11897/SP.J.1016.2023.01339]
                 [10]  李建江, 刘珍珍, 王珏. 基于  IBM Cell 多核平台的  OpenMP  数组私有化技术研究. 计算机研究与发展, 2010, 47(8): 1434–1441.
                 [12]  何王全, 刘勇, 方燕飞, 魏迪, 漆锋滨. 面向国产异构众核系统的     Parallel C  语言设计与实现. 软件学报, 2017, 28(4): 764–785. http://
                     www.jos.org.cn/1000-9825/5197.htm [doi: 10.13328/j.cnki.jos.005197]
                 [13]  刘 勇 ,  刘 丽 ,  何 王 全 .  面 向 众 核 多 级 访 存 资 源 的 静 态 数 据 布 局 优 化 模 型 .  计 算 机 应 用 与 软 件 ,  2011,  28(7):  53–56.  [doi:
                     10.3969/j.issn.1000-386X.2011.07.016]
                 [15]  伍明川, 刘颖, 李立民, 冯晓兵. 面向神威·太湖之光的多核组协同的        OpenCL  编译方法. 高技术通讯, 2022, 32(9): 927–936. [doi:
                     10.3772/j.issn.1002-0470.2022.09.006]
                 [17]  姜云桥. 基于新一代申威众核处理器的     Transformer 模型并行优化的研究 [硕士学位论文]. 上海: 华东师范大学, 2022. [doi: 10.27149/
                     d.cnki.ghdsu.2022.002946]


                             方燕飞(1980-), 女, 高级工程师, 主要研究领域                 王云飞(1995-), 男, 硕士, 主要研究领域为软件
                            为并行语言, 编译优化.                                 工程.




                             李雁冰(1989-), 男, 博士, 助理研究员, 主要研                刘齐(1992-), 男, 助理研究员, 主要研究领域为
                            究领域为并行编译.                                    并行语言, 编译优化.





                            究领域为高性能计算软件.
   86   87   88   89   90   91   92   93   94   95   96