Page 459 - 《软件学报》2024年第6期
P. 459

朱光辉 等: 基于自引导进化策略的高效自动化数据增强算法                                                    3035


                                     表 A1    13  种图像数据增强函数以及增强幅度取值范围             (续)

                    增强函数                                 描述                               增强幅度取值范围
                   AutoContrast  通过将最暗的像素设置为黑色, 将最亮的像素设置为白色, 来最大化图像对比度                         -
                     Invert                          反转图像的像素                                   -
                    Equalize                         均衡图像直方图                                   -
                    Solarize                    反转所有超过某个幅度的像素                                [0, 256]
                    Posterize                 将每个像素的位数减少到某个幅度                                 [4, 8]
                    Contrast      控制图像的对比度, 幅度为0时输出灰度图像, 幅度为1时输出原始图像                         [0.1, 1.9]
                     Color        调整图像的色彩平衡, 幅度为0时输出黑白图像, 幅度为1时输出原始图像                        [0.1, 1.9]
                    Brightness     调整图像的亮度, 幅度为0时输出黑色图像, 幅度为1时输出原始图像                         [0.1, 1.9]
                    Sharpness     调整图像的清晰度, 幅度为0时输出模糊的图像, 幅度为1时输出原始图像                        [0.1, 1.9]
                     Cutout             将边长大小为某个幅度的随机正方形色块设置为灰色                               [0, 60]

                                        表 A2    6  种语音数据增强函数以及增强幅度取值范围

                       增强函数                                描述                           增强幅度取值范围
                             朱振南(1999-), 男, 硕士生, 主要研究领域为数
                         Gain          以某个概率将音频乘以某个随机幅度因子减小或者增加音量                            [0, 1]
                     ImpulseResponse         以某个概率将音频与脉冲响应音频进行卷积                             [0, 1]
                    PeakNormalization          以某个概率将音频的音量进行归一化                              [0, 1]
                     PolarityInversion             以某个概率反转音频样本                               [0, 1]
                         Shift                  以某个概率先前或者向后移动音频                              [0, 1]
                     ShuffleChannels               以某个概率调整音频声道                               [0, 1]

                                        表 A3    6  种文本数据增强函数以及增强幅度取值范围

                          增强函数                             描述                         增强幅度取值范围
                          Spelling            以某个概率使用拼写错误的单词代替单词                           [0, 1]
                          Synonym              以某个概率用WordNet的同义词代替单词                       [0, 1]
                          Antonym                 以某个概率用反义词代替单词                            [0, 1]
                       RandomWordSwap               以某个概率随机交换单词                            [0, 1]
                      RandomWordDelete              以某个概率随机删除单词                            [0, 1]
                       RandomWordCrop           以某个概率随机删除一组连续的单词                           [0, 1]


                             朱光辉(1987-), 男, 博士, 助理研究员, CCF  专             袁春风(1963-), 女, 博士, 教授, CCF  高级会员,
                            业会员, 主要研究领域为自动化机器学习, 数据                      主要研究领域为大数据, 信息检索, 计算机体系
                            挖掘.                                          结构.




                             陈文忠(1996-), 男, 硕士生, 主要研究领域为自                 黄宜华(1962-), 男, 博士, 教授, 博士生导师,
                            动化机器学习.                                      CCF  高级会员, 主要研究领域为大数据, 分布式
                                                                         与并行计算, 机器学习.






                            据挖掘, 图机器学习.
   454   455   456   457   458   459   460   461   462   463   464