Page 496 - 《软件学报》2025年第5期
P. 496

2396                                                       软件学报  2025  年第  36  卷第  5  期


                 的结构, 网络拓扑和物理量子比特排列信息的缺失, 使得                 DQP  生成的初始量子比特映射质量低于            DQM; (2) DQP
                 在移动量子态时所用的往返传输策略虽然简单易实现, 但在优化                      SWAP  门和  ST  门数上存在很大局限性, 相反,
                 DQM  所用的  IQP  和  CQP  策略能在多个候选操作中选择最有利于降低路由代价的                 SWAP  门或  ST  门, 从而减少所
                 需的  SWAP  门和  ST  门总数. 此外, DQM  和  DQP  在所有基准线路上所需的       SWAP  门数均普遍多于      ST  门数, 这主
                 要是由于无论是将非局域门转换成局域门还是将局域门转换成可执行门均需插入                            SWAP  门, 而  ST  门仅在转换非
                 局域门时用到. 在时间开销方面, DQM          和  DQP  均是多项式时间复杂度算法, 且在进行分布式量子比特映射时均采
                 用了多迭代的算法模型, 因此两者的时间开销相近.

                 5.3   QPU  内量子态路由策略的性能评价
                    面向单个    QPU  芯片的量子线路映射在近几年得到了大量关注和研究, 但由于底层架构的巨大差异, 这些已有
                 方法无法直接适用于分布式场景. 然而, 仅将这些方法用于实现分布式映射场景下                         QPU  内的量子态路由是显然可
                 行的. 本文通过将     Qiskit [42] 中的两种先进量子线路映射方法      (LookaheadSwap  和  SabreSwap) 分别集成至本文所提
                 的分布式量子态路由算法         (见算法   3), 实现了另外两种版本的分布式路由算法. 所用集成方式如下: 当算法                   3  执行
                 到  QPU  内量子态路由时    (算法  3  第  11  行), 从当前量子线路为架构中的各       QPU  分别读取作用其上的由连续局域
                 门组成的最大待调度子线路, 并调用特定映射方法                  (LookaheadSwap  或  SabreSwap) 完成各局域子线路向特定
                 QPU  的映射任务. LookaheadSwap  方法和文献    [36] 类似, 通过对映射决策树的深度搜索选择最有利于线路执行的
                 SWAP  门, 以下将集成    LookaheadSwap  的分布式量子态路由方法简称为         DQM_L  算法; SabreSwap  方法  [31] 采用了
                 一种前瞻性启发式搜索规则, 通过计算候选               SWAP  门的映射代价函数值, 选择待插入的            SWAP  门, 以下将包含
                 SabreSwap  的分布式量子态路由方法简称为         DQM_S  算法.
                    为评价   QPU  内量子态路由策略, 在所有基准测试线路上对               DQM、DQM_L    和  DQM_S  分别进行测试. 公平
                 起见, 3  种算法在每个基准线路上的实验均采用相同的初始映射:

                                                     for i in [0, 3] for j in [0, 5]}                (11)
                                                π = {v i j
                 即, 为量子线路中的各逻辑比特按以下顺序依次分配物理比特:{v 00 , v 01 , v 02 , v 03 , v 04 , v 05 , v 10 , v 11 , v 12 , …}.
                    后文图   7  给出了  3  种算法在所有基准线路       (见表  2) 上所需的平均    SWAP  门数、ST  门数和平均用时, 其中左
                 边的纵轴用于统计门数, 而右边的纵轴表示时间                (以  s 为单位). 从图  7  可知, 3  种算法所需的平均    ST  门数大致相
                 当, 这是由于三者采用了相同的           QPU  间量子态路由策略, 至于        ST  门数上的少量差异主要源于在平局情况下
                 QPU  间量子态路由策略所作的随机选择. 相反, 由于三者采用了不同的                   QPU  内量子态路由策略, 其在平均        SWAP
                 门数存在较大差异. 即便       LookaheadSwap  和  SabreSwap  等方法在单  QPU  映射问题上表现优异, 但在分布式映射
                 场景下显然表现欠佳, 其分别对应的           DQM_L  和  DQM_S  算法在平均    SWAP  门数上均明显多于      DQM  算法. 经分
                 析原因如下: 在分布式映射进行到          QPU  内量子态路由进程时, 由于受非局域门的间隔, 在各               QPU  上即将调度的由
                 连续局域门构成的子线路通常是浅层子线路, 这些局域子线路极小的线路深度使得现有单                              QPU  映射方法无法充
                 分发挥出所用深度搜索或前瞻性启发式搜索技术的优势; 另外, 由于这些单                       QPU  映射方法并不区分通信量子比特
                 和数据量子比特, 因此在进行量子态路由时极易使一些待移出                     QPU  的量子态远离通信量子比特, 从而增加了后
                 续  QPU  间量子态传输所需的      SWAP  门开销. 相反, DQM   算法基于整个分布式连通图构建量子态路由策略, 如公
                 式  (7) 所示的效应函数中所考虑的多层子线路并不会被非局域门打断, 从而保证了较强的前瞻能力. 从图                              7  还可
                 知, DQM_L  算法的平均耗时远高于        DQM  和  DQM_S  算法, 这主要由于其采用的深度搜索策略, 在其默认配置中,
                 每次选择   SWAP  门时均需在决策树上向下探索           5  层, 而  DQM  和  DQM_S  算法均是根据启发式代价函数直接做出
                 决策. 综上, 相较   DQM_L  算法和  DQM_S  算法, DQM  算法在平均门数和时间性能上均表现更佳, 这也表明了在分
                 布式场景下进行      QPU  内量子态路由时感知量子态在其他           QPU  分布情况的重要性.

                 5.4   网络拓扑对算法性能的影响
                    网络拓扑是设计分布式量子计算系统时需要考虑的重要因素之一, 其对量子线路映射所需的路由代价同样有
                 着重要影响. 为了评价网络拓扑对本文            DQM  算法的性能影响, 我们构建了一个具有线性拓扑的网络. 除拓扑结构
   491   492   493   494   495   496   497   498   499   500   501