Page 101 - 《软件学报》2025年第7期
P. 101

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(7):3022−3040 [doi: 10.13328/j.cnki.jos.007336] [CSTR: 32375.14.jos.007336]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                           *
                 深度学习编译器缺陷实证研究: 现状与演化分析

                 沈庆超  1 ,    田家硕  1 ,    陈俊洁  1 ,    陈    翔  2 ,    陈庆燕  3 ,    王    赞  1


                 1
                  (天津大学 智能与计算学部, 天津 300350)
                 2
                  (南通大学 人工智能与计算机学院, 江苏 南通 226019)
                 3
                  (山东航空学院 信息工程学院, 山东 滨州 251700)
                 通信作者: 陈俊洁, E-mail: junjiechen@tju.edu.cn

                 摘 要: 深度学习编译器已被广泛应用于深度学习模型的性能优化和部署. 与传统编译器类似, 深度学习编译器也
                 存在缺陷. 存在缺陷的深度学习编译器会导致编译失败或者产生错误的编译结果, 甚至有时会带来灾难性的后果.
                 为了深入理解深度学习编译器缺陷的特性, 已有工作针对深度学习编译器早期的                           603  个缺陷进行研究分析. 近年
                 来, 深度学习编译器在快速迭代更新, 伴随着大量新特性的引入和旧特性的弃用. 与此同时, 一些针对深度学习编
                 译器缺陷的检测工具已被开发出来. 因此, 需要分析之前对深度学习编译器缺陷的研究结论是否依然适用. 此外,
                 缺乏对缺陷症状、根因、位置三者之间关系的深入挖掘, 并且缺乏对触发缺陷的回归测试用例特征和修复缺陷的
                 补丁特征的研究. 为了深入分析当下深度学习编译器缺陷特征和缺陷分布随时间的演化过程, 收集当前                                  3  款主流
                 深度学习编译器      (即  Apache 的  TVM、Facebook  的  Glow  和华为的  AKG) 中的  613  个近期修复的缺陷, 并对缺陷
                 的根因、症状、位置等特征进行人工标注. 基于标注结果, 从多个不同角度深入挖掘缺陷的分布特征,并与已有研
                 究进行对比分析. 同时, 对触发缺陷的回归测试用例和修复缺陷的补丁进行研究. 最终获得                           12  个主要研究发现, 以
                 全面了解深度学习编译器缺陷现状与演变过程, 并为深度学习编译器缺陷的检测、定位、修复提供一系列可行的
                 指导方案. 最后, 为了验证这些研究发现的有效性, 开发了一款基于优化配置的测试工具                          CfgFuzz. CfgFuzz 通过对
                 编译配置选项进行组合测试, 最终检测到             8  个  TVM  缺陷, 其中  7  个缺陷已被开发人员确认或修复.
                 关键词: 深度学习编译器; 缺陷分析; 实证研究; 缺陷检测; 缺陷特征
                 中图法分类号: TP311

                 中文引用格式: 沈庆超,  田家硕,  陈俊洁,  陈翔,  陈庆燕,  王赞.  深度学习编译器缺陷实证研究:  现状与演化分析.  软件学报,  2025,
                 36(7): 3022–3040. http://www.jos.org.cn/1000-9825/7336.htm
                 英文引用格式: Shen QC, Tian JS, Chen JJ, Chen X, Chen QY, Wang Z. Toward Understanding the Current Status and Evolution of
                 Deep Learning Compiler Bugs. Ruan Jian Xue Bao/Journal of Software, 2025, 36(7): 3022–3040 (in Chinese). http://www.jos.org.cn/
                 1000-9825/7336.htm

                 Toward Understanding the Current Status and Evolution of Deep Learning Compiler Bugs
                              1           1           1          2             3          1
                 SHEN Qing-Chao , TIAN Jia-Shuo , CHEN Jun-Jie , CHEN Xiang , CHEN Qing-Yan , WANG Zan
                 1
                 (College of Intelligence and Computing, Tianjin University, Tianjin 300350, China)
                 2
                 (School of Artificial Intelligence and Computer Science, Nantong University, Nantong 226019, China)
                 3
                 (School of Information Engineering, Shandong University of Aeronautics, Binzhou 251700, China)
                 Abstract:  Deep  Learning  compilers  (DL  compilers)  are  widely  applied  to  optimize  and  deploy  deep  learning  models.  Similar  to  traditional
                 compilers,  DL  compilers  also  possess  bugs.  The  buggy  DL  compilers  can  cause  compilation  failures,  generate  incorrect  compilation  results


                 *    基金项目: 国家自然科学基金  (62322208, 12411530122)
                  本文由“新兴软件与系统的可信赖性与安全”专题特约编辑向剑文教授、陈厅教授、杨珉教授、周俊伟教授推荐.
                  收稿时间: 2024-08-24; 修改时间: 2024-10-15; 采用时间: 2024-11-25; jos 在线出版时间: 2024-12-10
                  CNKI 网络首发时间: 2025-04-03
   96   97   98   99   100   101   102   103   104   105   106