淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別

做個(gè)善良的人

2021年11月8日 10:54

引言

我們可以通過一個(gè)比喻來解釋什么是行為風(fēng)險(xiǎn)識(shí)別：自動(dòng)駕駛的機(jī)器大腦在參加一場考試，他遇到一道難題，在兩個(gè)答案之間猶豫不決。盡管這道難題他不會(huì)做，但我們可以通過許多方式得知他“拿不準(zhǔn)”這件事本身，例如題目描述的場景復(fù)雜或者之前不熟悉，并進(jìn)一步針對這道題目請求“人類教練”的幫助。

淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別的圖1

自動(dòng)駕駛的機(jī)器大腦如何工作？

我們?nèi)祟愒陂_車的時(shí)候，會(huì)由眼睛和耳朵等“傳感器”完成對環(huán)境信息的探測和感知，然后這些信息傳入我們的大腦，大腦經(jīng)過所有的處理之后，發(fā)出直接的動(dòng)作指令給“控制器“——我們的手和腳。

對于人類大腦的工作過程，我們還所知有限。而在當(dāng)前的自動(dòng)駕駛技術(shù)中，有一種嘗試是“端到端”技術(shù)，也就是完全模擬我們的大腦，試圖直接將傳感器獲得的環(huán)境信息輸入深度神經(jīng)網(wǎng)絡(luò)，直接輸出對車輛的控制信號(hào)。

這類方法存在一個(gè)最大的問題就是深度神經(jīng)網(wǎng)絡(luò)缺乏可解釋性。當(dāng)遇到未知的場景時(shí)，我們無法保障網(wǎng)絡(luò)輸出結(jié)果的安全性。因此，當(dāng)前絕大部分自動(dòng)駕駛企業(yè)還是采用分層和解耦的思路，來解決自動(dòng)駕駛決策的問題。

在這種思路下，自動(dòng)駕駛的大腦工作由決策規(guī)劃模塊來完成

淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別的圖2

圖1. 自動(dòng)駕駛系統(tǒng)中的決策規(guī)劃模塊分層結(jié)構(gòu)

如圖1所示，典型的決策規(guī)劃模塊可以分為三個(gè)層次。其中，全局路徑規(guī)劃（Route Planning）在接收到一個(gè)給定的行駛目的地之后，結(jié)合地圖信息，生成一條全局的路徑，作為為后續(xù)具體路徑規(guī)劃的參考；行為決策層（Behavioral Layer）在接收到全局路徑后，結(jié)合從感知模塊得到的環(huán)境信息（包括其他車輛與行人，障礙物，以及道路上的交通規(guī)則信息），以及從預(yù)測模塊得到的障礙物未來可能行駛軌跡信息，作出具體的行為決策（例如選擇變道超車還是跟隨）；最后，運(yùn)動(dòng)規(guī)劃（Motion Planning）層根據(jù)具體的行為決策，規(guī)劃生成一條滿足特定約束條件（例如車輛本身的動(dòng)力學(xué)約束、避免碰撞、乘客舒適性等）的軌跡，該軌跡作為控制模塊的輸入決定車輛最終行駛路徑。

行為決策層的輸入輸出

通過上面的介紹我們已經(jīng)知道，機(jī)器大腦通過分層的方法來降低問題難度。在目前的技術(shù)發(fā)展階段，全局路徑規(guī)劃和運(yùn)動(dòng)規(guī)劃這兩個(gè)部分的方案已經(jīng)相對比較成熟。這一方面也是由于這兩層的任務(wù)目標(biāo)十分明確（我們的行駛目的地是確定的；運(yùn)動(dòng)規(guī)劃需要滿足的約束條件也是確定的）。

而在行為決策層，我們需要面對的則是一系列不確定性的輸入信息。這種不確定性的來源主要有兩大部分：

一部分來自環(huán)境，因?yàn)槲覀兊奈锢硎澜绫旧砭褪窃诓粩嘧兓模h(huán)境中其他交通參與者未來的行為我們無法明確得知（預(yù)測模塊的任務(wù)就是降低這一類不確定性）
另一部分來自傳感器在采集和處理環(huán)境信息的時(shí)候（將物理世界在數(shù)字世界中建模），不可避免地需要進(jìn)行采樣等離散化處理，這樣就導(dǎo)致真實(shí)物理世界的連續(xù)信息有一部分損失，同時(shí)也會(huì)產(chǎn)生空間上的誤差和時(shí)間上的延遲。

與之相對的是，行為決策層的輸出卻必須是確定性的結(jié)果，具體來說，這些輸出通常包括：

綜合決策（主車的綜合決策行為，如換道意圖和借道意圖）
個(gè)體決策（主車對單個(gè)障礙物做出的決策，如繞行和減速避讓）

用嚴(yán)格一些的語言來說，下游運(yùn)動(dòng)規(guī)劃層需要生成具體的行駛軌跡，在數(shù)學(xué)上這是一個(gè)非凸優(yōu)化問題，難以直接求解，因此行為決策需要將運(yùn)動(dòng)規(guī)劃的解空間進(jìn)行限定，保證運(yùn)動(dòng)規(guī)劃模塊的求解高效性和穩(wěn)定性。

為什么需要行為風(fēng)險(xiǎn)識(shí)別？

在處理這些輸入不確定性，并輸出確定性決策的過程中。我們需要考慮的目標(biāo)是多樣化的，不僅僅包括安全性，還要考慮交通規(guī)則、決策穩(wěn)定性，車輛模型，甚至還要求無人車的行為需要符合人類駕駛習(xí)慣（環(huán)境中存在大量與人類參與者的交互）。

我們需要將這些多目標(biāo)轉(zhuǎn)換為機(jī)器容易理解和處理的方式，具體手段包括：

約束目標(biāo)：將碰撞避免、交通規(guī)則等目標(biāo)轉(zhuǎn)換為不可以違反的邊界條件。
優(yōu)化目標(biāo)：對一些軟性的目標(biāo)（通行效率、舒適性等）設(shè)置不同權(quán)重的損失懲罰函數(shù)。

由于輸入信息的不確定性，我們的機(jī)器大腦在實(shí)際中常常面臨“兩難”的局面。例如下圖這樣十分常見的一種場景，選擇減速跟車還是換道超車。前者會(huì)影響通行效率，而后者則可能帶來更高的風(fēng)險(xiǎn)（旁邊車道來車）。

淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別的圖5

圖2. 常見的一種行為決策場景：減速or變道

而實(shí)際的場景更為復(fù)雜多變，并且一定會(huì)出現(xiàn)長尾場景，每一種行為決策的選擇都不可能完全避免未來的風(fēng)險(xiǎn)，決策輸出的多目標(biāo)求解過程無法保證每次都得到最低風(fēng)險(xiǎn)的結(jié)果。因此，我們需要在行為決策層增加一種以安全性為單目標(biāo)的算法模型，希望能夠?qū)赡馨l(fā)生的風(fēng)險(xiǎn)進(jìn)行提前的識(shí)別，當(dāng)安全性不滿足要求時(shí)采用人工接管或保守策略。

讀者可能提出的一個(gè)問題是：如果能夠建立這樣的風(fēng)險(xiǎn)識(shí)別模型，那不就可以作出最安全的行為決策了嗎？這個(gè)問題的答案其實(shí)就是在“知道正確答案”和“知道不會(huì)做”二者之間其實(shí)是存在一個(gè)gap的。在預(yù)期功能安全國際標(biāo)準(zhǔn)（ISO/PAS 21448）中，場景（scenarios）被劃分為如下圖所示的4個(gè)區(qū)間，分別為（1）已知-安全、（2）已知-不安全、（3）未知-不安全和（4）未知-安全。最終的目標(biāo)是盡可能縮小位于區(qū)間（2）和（3）中的場景（scenarios）比例，即將確保場景（scenarios）控制在安全的區(qū)間。而行為風(fēng)險(xiǎn)識(shí)別希望達(dá)到的目的就是將區(qū)間（3）中的場景首先轉(zhuǎn)化為區(qū)間（2），即“know unknowns”。接下來，隨著行為決策本身算法能力的不斷提升（越來越見多識(shí)廣），才能夠?qū)⒏嗟膮^(qū)間（2）場景轉(zhuǎn)化為區(qū)間（1）。

淺談自動(dòng)駕駛中的行為風(fēng)險(xiǎn)識(shí)別的圖6

圖3. 國際標(biāo)準(zhǔn)ISO/PAS 21448中對場景（scenarios）的分類

總結(jié)

無人車行為決策模塊面對的是高不確定性的動(dòng)態(tài)場景。在當(dāng)前技術(shù)階段，存在算法能力的覆蓋邊界。在邊界上存在的長尾問題是最難解決的一類問題，同時(shí)也是最危險(xiǎn)的場景。在我們的自動(dòng)駕駛算法不斷進(jìn)步，不斷擴(kuò)大能力邊界的同時(shí)，我們也希望通過對行為決策模塊各種指標(biāo)進(jìn)行在線監(jiān)控，同時(shí)結(jié)合周圍環(huán)境信息，希望從這些“蛛絲馬跡”中提前識(shí)別出危險(xiǎn)場景。然后對算法結(jié)果進(jìn)行反饋，并向人類安全員發(fā)出提醒。

行為風(fēng)險(xiǎn)識(shí)別的具體算法，以及識(shí)別后的處理方式，將在下次技術(shù)解析中詳細(xì)介紹。

參考文獻(xiàn)：

[1] https://mp.weixin.qq.com/s/5yH8aXDrPYjGJdv0npHkig

[2] 耿新力. 城區(qū)不確定環(huán)境下無人駕駛車輛行為決策方法研究[D]. 中國科學(xué)技術(shù)大學(xué), 2017.

[3] Russal S, Norvig P. Artificial intelligence: a modem approach[M]. Pearson Education, 2002.

[4] Furda a, Vlacic L. Enabling Safe Autonomous Driving in Real-World City Traffic Using Multiple Criteria Decision Making[J]. IEEE Intelligent Transportation Systems Magazine, 2011, 3(1): 4–17.

[5] https://mp.weixin.qq.com/s/oNHDzdxMy_ciAok79kLDYg

[6] Gonzalez D, Perez J, Milanes V, et al. A Review of Motion Planning Techniques for Automated Vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(4): 1135–1145.

[7] WAYDO S, MURRAY R M. Vehicle motion planning using stream functions[C]//2003 IEEE International Conference on Robotics and Automation (Cat. No.03CH37422). 2003, 2: 2484–2491 vol 2.

[8] Kirovskii, O. M., and V. A. Gorelov. "Driver assistance systems: analysis, tests and the safety case. ISO 26262 and ISO PAS 21448." IOP Conference Series: Materials Science and Engineering. Vol. 534. No. 1. IOP Publishing, 2019.