Page 226 - 《软件学报》2025年第8期
P. 226

田丽丽 等: 因果时空语义驱动的深度强化学习抽象建模方法                                                    3649



                                 ˆ T .
                 输出: 抽象迁移空间
                 1. 初始化抽象迁移空间      ˆ T ← 0, refined ← false
                 2. while !refined do
                 3.  for  (ˆs, ˆa) ∈ ˆ S × ˆ A do
                          ′
                 4.   for   ˆ s ∈ ˆ S  do
                 5.      ˆ p ← 根据公式  (8) 计算迁移概率  (ˆs, ˆa, ˆs )
                                                     ′
                 6.   end for
                 7.  end for
                 8.   error ← 根据霍夫丁不等式计算
                 9.  for  (ˆs, ˆa) ∈ ˆ S × ˆ A do

                 10.   if error < 阈值  ε then
                 11.       ˆ T.add(ˆs× ˆa → ˆs, ˆp)
                 12.    refined=true
                 13.   end if
                 14.  end for
                 15. end while
                                   ˆ T
                 16. 返回抽象迁移空间

                 5   实验分析

                 5.1   实验案例
                    本文的实验案例基于        3  个不同主题的自动驾驶场景, 涵盖了自动驾驶领域中最为常见且最重要的驾驶环境.
                 由于真实的实验环境限制, 我们的方法聚焦于               Carla 仿真环境, 并采用了高维数据来尽可能模拟真实环境. 通过对
                 比分析这些实验结果, 可以更全面地理解基于时空价值语义抽象的                      ICPS  在不同驾驶情境中的表现与应用.
                    ● 车道保持辅助     (lane keeping assist, LKA). LKA [30]  是一种高级驾驶辅助系统, 旨在帮助驾驶员将车辆保持在
                 车道内行驶. LKA    在实现自动化驾驶和提高驾驶安全性方面起着关键作用. 该系统通过测量车辆与道路中心线之
                 间的横向偏移     d lat  和相对偏航角  θ yaw , 并通过调整前轮转向角   θ steer  来保持车辆沿中心线行驶. LKA   的目标是使横向
                 偏移和偏航角都趋近于        0.
                    ● 自适应巡航控制      (adaptive cruise control, ACC). ACC [30]  是一种智能驾驶辅助系统, 其功能是自动调整车辆
                                                                                           d rel  始终大于安全
                 速度以保持与前车的安全距离. 该系统通过控制智能体的加速度                     a ego , 保持两车之间的相对距离
                                                                               v set . 前车的移动由前车的加速度
                 距离   d safe . 当确保安全距离后, 系统会使智能体尽可能达到用户设定的巡航速度
                 a lead  控制, 而安全距离则基于两车的相对速度动态变化.
                    ● 交叉路口会车辅助       (intersection crossroad assistant, ICA). ICA [30]  是一种先进的驾驶辅助系统, 旨在复杂的交
                 叉路口环境中提供支持, 以增强驾驶安全性. ICA             系统集成了    LKA  和  ACC  的特性, 能够确定最佳的行驶速度和方
                 向, 确保车辆在行驶过程中始终保持在正确的轨道上. 此外, ICA                 还具备随机性和混合性的特性. 随机性体现在在
                 面对复杂、难以预测的实际驾驶环境时, 系统能够做出适应并保持稳定控制. 混合性则表现在系统能够综合运用
                 多种驾驶策略和技术, 并根据实际需要灵活切换, 以提高系统应对复杂情况的能力.
                    在本文中, 所设计的      ICA  场景包括两条相互垂直的双向双车道、一辆智能体车辆和多辆环境车辆, 智能体需
                 通过左转、直行或右转等方式, 成功通过十字路口并抵达终点, 同时避免驶出道路或与环境车辆发生碰撞. 系统的
                 观测值需涵盖     LKA  和  ACC  所包括的维度.
   221   222   223   224   225   226   227   228   229   230   231