Page 16 - 《软件学报》2025年第8期
P. 16

谭思危 等: Fast-USYN: 从酉矩阵到高质量量子电路的快速合成                                             3439


                 减少合成量子电路中量子门的数量. 为了公平的测试, 本研究对被比较的方法的参数都进行了微调, 以保证其最优
                 性能. 当目标酉矩阵与电路之间的距离在             0.01  以内时, 合成结束并输出结果. 对于执行了超过           7  周的方法, 本研究
                 会终止程序并根据距离收敛曲线估计可能需要的时间.

                                                 表 3 实验中所用的量子算法

                               缩写                 算法                缩写              算法
                               QFT            量子傅里叶算法                HS           哈密顿模拟
                              ISING             伊辛模型                QNN          量子神经网络
                              QSVM            量子支持向量机               VQC         变分量子分类器
                               GHZ         格林伯格-霍恩-齐林格态              -               -

                    ● 指标. 所有实验均在具有       2  个  AMD EPYC 64  核  CPU  和  2TB DDR4  内存的服务器上进行. 为了做一个公平
                 的比较, 所有程序都只使用        20  个核心. 为了比较合成电路的质量, 研究记录了门的数量和电路的深度. 为了比较计
                 算成本, 本研究将合成时间记录为从启动程序启动到输出结果的时间.

                 5.2   实验结果
                    ● 合成时间的评估. 表      4  展示了  Fast-USYN  与  QSD [18] 、CCD [17] 、QFAST 和 [3]  QuCT [19] 相比的合成门数量以及
                 合成时间. 与   QuCT  相比, Fast-USYN  在  5  量子比特和  6  量子比特的量子电路合成上实现了         14.5  倍和  20.6  倍的加
                 速. 与  QFAST  相比, Fast-USYN  实现了  304.5  倍和  3 414.19  倍的加速. 与  QuCT  和  QFAST  相比, Fast-USYN  通过
                 对候选空间的剪枝和对量子门参数选择方法进行优化, 实现端到端的加速. 在候选空间方面, 进行                             6  量子比特量子
                 电路合成时, QFAST    每次迭代中需要搜索        62  个候选电路模块, 耗时约      4.8 h, 而  Fast-USYN  只搜索  35  个候选. 此
                 外, QFAST  需要首先将酉矩阵分解为更小的酉矩阵, 从而需要额外迭代用于进一步分解, 而                        Fast-USYN  直接合成
                 基本门而无需进一步分解.

                                           表 4 4  种电路合成方法与      Fast-USYN  的比较

                               5 量子比特             6 量子比特              7 量子比特              8 量子比特
                    方法
                            门数    深度    时间    门数     深度    时间     门数     深度    时间     门数     深度    时间
                   QSD [18]  1 247.5  465.5  1.5 s  4 761.2  3 652.8  3.6 s  3.8×10 4  3.6×10 4  20.5 h  7.8×10 4  3.1×10 4  111.5 s
                   CCD [17]  1 376.5  528.1  2.1 s  5 696.1  4 920.3  7.3 s  2.8×10 4  1.8×10 4  33.5 s  9.3×10 4  3.6×10 4  253.5 s
                  QFAST [3]  887.5  294.1  60.9 h  3 597.1  473.3  6.3 w  -  -  > 6 m  -      -    > 1 y
                   QuCT [19]  788.1  227.7  2.9 h  3 360.2  432.5  6.4 h  1.5×10 4  671.7  9.4 h  3.1×10 4  1 030.6  17.3 h
                  Fast-USYN  468.1  182.1  0.2 h  1 255.4  213.2  0.31 h  7 135.2  319.8  2.2 h  1.8×10 4  452.2  4.6 h
                  提升 (倍)    1.6   1.3   14.5   2.7   2.0   20.6   2.1    2.1    4.1   1.7    2.3    3.7
                 注: (1) “w”表示星期, “m”表示月, “y”表示年; (2) 提升表示了Fast-USYN相比于QuCT [19] 的改进程度

                    对于  7  量子比特和   8  量子比特的合成, QFAST     需要几个月或几年的时间, 与之相比, Fast-USYN          实现了数百
                 倍加速. 尽管   Fast-USYN  在  7  量子比特和  8  量子比特量子电路合成产生的门数仍然呈指数级增长, 这是由于酉矩
                 阵的参数量在数学上就是指数级别的. 但与             QuCT  相比, Fast-USYN  仍然将合成时间从     9.4 h、17.3 h 减少到  2.2 h、
                 4.6 h. QSD  和  CCD  算法比  Fast-USYN  算法耗时少, 但  Fast-USYN  提供了较大的优化机会, 例如, 将   8  量子比特合
                                            4
                                4
                 成的门数从    7.8×10 减少到   1.8×10 . 此外, 由于噪声在当前硬件上对于量子程序影响更为重要, Fast-USYN                最高
                 4.6 h  的合成时间在量子电路合成时是可接受的.
                    ● 合成电路的质量. 图      6  比较了  Fast-USYN  与  QuCT  合成结果和最优的量子程序实现的编译质量. 其中最优
                 实现来自当前已知的手动设计的量子程序的文章. 从表                  4  中可知, 与  QSD [18] 、CCD [17] 相比, Fast-USYN  分别最多
                 减少了   76.6%  和  80.4%  的量子门数量, 从而产生更高质量的电路. 例如, 对于            8  量子比特随机生成酉矩阵, 与
                                                       4
                                                                   4
                 QSD  相比, Fast-USYN  将门的平均数量从     7.8×10 减少到  1.8×10 . 在当前的数据集上, 与    QuCT  相比, Fast-USYN
                                                                                            4
                                                                               4
                 减少了   37.5%–63.0%  量子门数量, 并将   8  量子比特合成的门从      3.1×10 到 4  1.8×10 , 减少了  1.3×10 个门. QuCT  采
   11   12   13   14   15   16   17   18   19   20   21