【科技前沿】
本报北京4月11日电(记者 邓晖 通讯员田姬熔、常潇予)飞速发展的自动驾驶技术让汽车迈入“无人之境”的梦想不再遥不可及,但要想真正实现自动驾驶汽车的大规模商业化落地,安全测试验证成为行业进一步发展的重中之重。自动驾驶汽车到底是“新手上路”,还是车技稳如“老司机”?近日,清华大学自动化系智能交通研究团队助理教授封硕与美国密西根大学Mcity主任刘向宏等科研人员合作研发出一套全新的安全测试系统,为“AI司机”量身定制出一套“驾考试题”。日前,该项研究成果以《基于密集强化学习的自动驾驶汽车安全性测试》为题发表于《自然》正刊,并登上当期封面。
随着自动驾驶技术的发展,当驾驶水平越来越接近人类驾驶员,自动驾驶汽车的安全性能测试变得愈发重要,但同时也更难以开展。封硕告诉记者:“目前业内对此已初步达成了研究共识:亟须解决‘百亿公里’难题。”
什么是“百亿公里”难题?
研究人员介绍,在自动驾驶汽车投入大规模应用前,需要开展大规模的道路测试,从统计学上验证自动驾驶汽车的安全性。据估算,这个测试规模至少要达到百亿公里。从时间、资源与成本上来看,在实际道路上进行测试显然难以实现。这便是当前自动驾驶技术发展所面临的最棘手问题之一。
“我们所做的就是希望能够加速这个过程,用尽可能少的测试里程等价代替这百亿公里的实地测试。”封硕表示。
如何以最小的成本、最高效地找出自动驾驶汽车的安全问题?封硕带领团队从统计学的视角寻找研究切入点。
经验丰富的司机在开车时遇到突发状况,会结合道路情况、附近车辆的反馈,凭借直觉判断并迅速作出反应,那么同样的情况摆在人工智能面前,它该如何作出决策?
“这本质上是一个超高维空间小概率事件的期望估计问题。”封硕解释道,“人机交互的复杂性与道路交通状态的复杂性决定了自动驾驶汽车需要处理超高维空间内发生的各种情况,这是我们面对的‘维度灾难’。而在测试中为了验证安全性,我们需要自动驾驶汽车学会处理各种危险状况下的交通事件,由于危险状况往往是小概率事件,所以我们还会面临‘稀疏度灾难’。”
将实际问题从统计学的视角转化为学术问题后,封硕和团队成员从理论层面寻求突破,创造性地提出了密集强化学习方法,通过识别和删除非安全关键状态、连接安全关键状态,并在编辑后的马尔科夫过程中训练神经网络,解决了“稀疏度灾难”。同时利用密集强化学习方法训练交通环境中的背景车辆,构建出一个由自动驾驶汽车和背景车辆组成的智能测试环境,从而实现了模拟环境替代实际道路环境。
“通俗来讲,我们的智能测试系统将自动驾驶汽车周围的背景车辆模拟成为一个个智能体,大家有着不同的驾驶目的:自动驾驶汽车希望更安全地行驶,背景车辆希望更好地帮助自动驾驶汽车发现安全问题。这样我们就可以通过改变背景车辆的行为来实现对自动驾驶汽车安全性能的测试,让测试里程大幅减少,让测试过程变得更高效。”封硕形象地将这一过程比喻成为“AI司机”寻找“陪练”。
为了让“陪练”更精准有效地提供帮助,研究团队收集了海量人类驾驶数据,对“陪练”进行拟人化训练,从而确保测试环境更加贴合人类驾驶环境。同时还通过技术手段增加“陪练”司机的“危险系数”,让它们在行驶过程中表现出更强的侵略性与对抗性,从而增加测试环境的挑战性。
基于增强现实测试平台,研究团队将经过反复理论推演的研究思路在美国密西根大学Mcity和美国交通中心的测试场中付诸实践,对L4级自动驾驶汽车开展安全性测试。结果表明,这种方法不但可以有效学习生成智能测试环境,并且与直接在自然驾驶环境中测试自动驾驶汽车相比,智能测试环境可以加快评估过程多个数量级。这意味着,实验中每一公里的测试,近似等价于实际道路测试中一千到一万公里的结果,极大加速了安全测试流程。
“我们这套方法为‘AI验证AI’这种研究思路提供了一个可供借鉴的具体案例。”封硕对于当前的研究还有更长远的构想,“这套方法未来有潜力拓展到更广泛的领域,这也是我们未来的研究方向。同时,这项研究成果未来更有潜力为下一步自动驾驶技术的研发进行方向性的引鉴和指导:通过测试找到问题,对症下药地开展优化安全设置和性能的研究,就能间接地推动自动驾驶安全性的有效提升。”