Page 391 - 《软件学报》2025年第9期
P. 391
4302 软件学报 2025 年第 36 卷第 9 期
200 190.7 197.1 200 195.0 197.2
175 175
150 150
125 125
CR 100 CR 100
75 75
50 39.3 50 36.3 46.6
30.0
25 20.7 25 19.9
0 0
gzip bzip2 lzma NCQT-T NCQT-G gzip bzip2 lzma NCQT-T NCQT-G
(a) Train Ticket (9.8 GB) (b) Sock Shop (4.1 GB)
200 192.9 197.6 200
175 175
150 150
125 125 109.5 110.5
CR 100 CR 100
75 75
50 33.7 50 40.0
21.8 30.2 29.5
25 25 16.6
0 0
gzip bzip2 lzma NCQT-T NCQT-G gzip bzip2 lzma NCQT-T NCQT-G
(c) Robot Shop (6.0 GB) (d) Astronomy Shop (5.8 GB)
图 9 不同大文件数据集压缩效果对比
表 4 不同压缩算法的时间成本 (s)
Train Ticket Sock Shop Robot Shop Astronomy Shop
方法
压缩 解压 压缩 解压 压缩 解压 压缩 解压
gzip 16 3 11 2 19 2 25 2
bzip2 137 17 107 17 130 18 141 22
lzma 91 3 61 3 88 3 101 3
TRACE 60 916 57 939 46 491 32 673 52 656 37 901 62 238 41 598
DZip 56 096 27 942 39 789 21 612 53 309 26 776 58 888 27 309
NCQT-T 1 003 1 036 440 434 573 435 447 379
NCQT-G 803 738 344 316 430 290 347 291
2 000 冗余抽取
训练
1 000 压缩
解压
500
时间 (min) 100
30
10
1
TRACE DZip NCQT-T NCQT-G TRACE DZip NCQT-T NCQT-G TRACE DZip NCQT-TNCQT-G TRACE DZip NCQT-TNCQT-G
Train Ticket Sock Shop Robot Shop Astronomy Shop
图 10 基于神经网络的压缩算法效率对比

