论文阅读：《Collision Avoidance Testing of the Waymo Automated Driving System》

news2025/2/21 3:48:42

文章目录

1 背景
2 方法
- 2.1 Overview
- 2.2 安全测试目标
- - 2.2.1 测试目标设定方法（Method to Set the Test Objective）
  - 2.2.2 测试目标度量方法（Metrics to Measure the Test Objectives）
- 2.3 基于潜在危机情况的测试场景（Test Scenarios based on Potentially Critical Situations）
- 2.4 测试用例分配（Test Case Allocation）
- - 2.4.1 测试用例分配的指导原则（Guiding Principles for Test Case Allocation）
  - 2.4.2 数据收集的安全性（Safety for Data Collection）
  - 2.4.3 虚拟测试平台的性能（Capabilities of the Virtual Test Platform）
  - 2.4.4 测试执行（Test Execution）
  - 2.4.5 安全评估（Safety Evaluation）
3 结果
4 总结（个人）

1 背景

这是一篇来自国外自动驾驶公司，waymo关于测试L4自动驾驶车安全性的论文。

文章主要讨论了Collision Avoidance Testing（CAT） methodology，避撞测试方法是如何进行的。当然CAT方法仅仅是waymo评估自动驾驶系统（ADS）安全性的众多方法之一。

CAT方法的本质是基于场景的测试方法（scenario-based testing method），方法可以简要描述为：对比自动驾驶系统（ADS）和行为参考模型在陷入其他道路使用者发起的冲突时，二者的性能优劣。其中，行为参考模型即代表人类。所以通俗来讲，可以把这个测试当做ADS与人类司机的对比。

另外，值得关注的是“scenario-based testing method”，它的定义是：“a temporal sequence of scene elements, with actions and events of the participating elements occurring within this sequence.” (Riedmaier et al. 2020).。 “一个场景元素的时间序列，参与元素的动作和事件都发生在这个序列中”。这个测试方法已经有大量的工作在做了，有很多挑战，比如说“什么样的场景才能够有效揭示安全性”。这里先记下来，暂时留个印象，毕竟这篇文章主要还是讲CAT的。

2 方法

2.1 Overview

CAT方法的范围是，ADS作为“响应方”，当其他道路使用者做出出乎意料行为时，ADS采取紧急制动避免或减轻碰撞的性能。图糊了，这里自己重画一个。

请添加图片描述

2.2 安全测试目标

2.2.1 测试目标设定方法（Method to Set the Test Objective）

ISO起草的基于场景的安全测试提供了两种可能的方法来设定安全测试目标：

“an upper boundary value of the acceptable occurrence rate of a measurable behavior of the ADS”。ADS 可测量行为的可接受发生率的上限值”。比如说“系统危险行为在系统操作范围内每小时不得发生一次”。个人理解就是一些可以揭示安全的指标的上限，超出这个上限就认为ADS性能不行
“a performance reference model regarding the capability of the ADS to handle certain scenarios safely, based on minimum performance levels required for these scenarios”。“根据这些场景所需的最低性能水平，建立一个关于 ADS 安全处理这些场景的能力的性能参考模型”。比如说“任何信心的人类司机能够避免的安全事故，ADS都应该避免掉”

waymo的话，CAT是以上两种方法的结合，这里使用的人类行为参考模型被称作“NIEON”，它的全称是：the Non-Impaired and Eyes ON the conflict model driver。这个模型表现出一种在当前人类驾驶人群中不存在的表现水平，换言之，就是没有人类在避撞下可以比NIEON开的更好。该模型的响应时间和规避动作都是基于最先进的人类驾驶数据研究得到的。

研究表明，这个NIEON模型能够减轻84%的严重碰撞。当然了NIEON模型在应用中也会简化一些建模，不过它仍然可以当做是一种基准。毕竟84%这个数字在这摆着呢。

2.2.2 测试目标度量方法（Metrics to Measure the Test Objectives）

ADS对比NIEON的性能具体设计成一个聚合评分，这个评分是根据场景组做的。这里waymo将用于测试的场景划分成不同的“安全组”，这里的安全组是根据“冲突类型”和“冲突参与者”定义的，且安全组下包含子类。这里画了个图，论文里的图片不知怎么变成了全损画质，有些字都看不清，这里我勉强重新画了一下。这样划分场景测试的好处也是方便多维度去对比ADS和NIEON的性能。
请添加图片描述