智能汽車中人工智能算法應(yīng)用及其安全綜述
翟 強1*,程 洪1,黃 瑞1,詹慧琴1,趙 洋1,李 駿2
(1. 電子科技大學(xué)機器人研究中心 成都 611731;2. 清華大學(xué)車輛與運載學(xué)院 北京 海淀區(qū) 100091)
【摘要】隨著人工智能(AI)技術(shù)的發(fā)展,以智能駕駛汽車、智能機器人為代表的智能系統(tǒng)逐漸代替或輔助人類從事各種場景中簡單或復(fù)雜的工作。該文從智能汽車中的智能算法出發(fā),總結(jié)了在智能汽車中人工智能感知算法、決策算法的研究進(jìn)展;討論了智能算法的不確定性問題;并從智能算法的不確定性帶來的安全問題角度,討論了預(yù)期功能安全的意義及發(fā)展,最后討論了人機共駕對當(dāng)前智能駕駛汽車解決預(yù)期功能安全的必要性。
關(guān) 鍵 詞 人工智能;人機共駕;智能駕駛;預(yù)期功能安全;統(tǒng)計模式識別
近年來,智能化革命席卷全球,以深度學(xué)習(xí)為核心的AI 技術(shù)取得了重大突破。在機器人[1]、語音識別[2-3]、圖像識別[4-7]、自然語言處理[8-9]等多個任務(wù)上,人工智能技術(shù)的識別能力和決策水平已經(jīng)追平甚至超越人類,如以AlphaGo 為代表的人工智能機器人擊敗人類職業(yè)圍棋冠軍,以Google、百度等工業(yè)界為代表的無人駕駛汽車已經(jīng)開始實際道路上路測試等。
美國斯坦福大學(xué)尼爾遜教授將人工智能定義為:“人工智能是關(guān)于知識的學(xué)科—怎樣表示知識以及怎樣獲得知識并使用知識的科學(xué)”[10]。麻省理工學(xué)院溫斯頓教授認(rèn)為:“人工智能就是研究如何使計算機去做過去只有人才能做的智能工作”。這些說法[10-11]反映了人工智能學(xué)科的基本思想和基本內(nèi)容,以及其他諸多對人工智能的理解[12-14]。這些觀點都反應(yīng)了人工智能是通過研究人類智能活動規(guī)律,構(gòu)造具有一定智能的人工系統(tǒng),研究如何應(yīng)用計算機的軟硬件技術(shù)來模擬和代替人類某些智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃、控制等)的基本理論、方法和技術(shù)。
人工智能技術(shù)的發(fā)展受到了廣泛的重視,并在機器人、控制系統(tǒng)中得到了廣泛應(yīng)用,為傳統(tǒng)制造業(yè)提供了前所未有的發(fā)展機遇。汽車行業(yè)作為傳統(tǒng)制造業(yè)的龍頭之一,也立足自身發(fā)展,結(jié)合智能化技術(shù),展開了傳統(tǒng)汽車面向智能化革新的進(jìn)程。智能汽車以汽車為載體,應(yīng)用一系列高精尖信息化技術(shù)和智能化技術(shù)(傳感器感知技術(shù)、V2X 網(wǎng)聯(lián)通訊技術(shù)、駕駛決策技術(shù)等),即代表了汽車技術(shù)產(chǎn)業(yè)化進(jìn)程的重要方向,也是汽車技術(shù)創(chuàng)新發(fā)展的主流趨勢。我國工信部把智能汽車定義為:搭載先進(jìn)的車載傳感器、控制器、執(zhí)行器等裝置,并融合現(xiàn)代通訊與網(wǎng)絡(luò)技術(shù),實現(xiàn)車與車、人、路、云等智能信息的交換、共享,具備復(fù)雜環(huán)境感知、智能決策、協(xié)同控制等功能,可實現(xiàn)安全、高效、舒適、節(jié)能行駛,并最終可實現(xiàn)代替人來操作的新一代汽車。
智能汽車中的智能化技術(shù),可分為3 個模塊:環(huán)境感知層、決策規(guī)劃層和運動控制層。環(huán)境感知層利用環(huán)境感知傳感器(視覺傳感器、激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)、里程計、GPS 等)感知車輛行駛環(huán)境信息,利用車輛自身狀態(tài)傳感器(如輪速檢測等)感知車輛自身狀態(tài)。經(jīng)過智能化模型處理后,感知出車輛周圍環(huán)境(如絕對位置、車道線、周圍車輛相對位置、行人位置、動態(tài)靜態(tài)障礙物類型和位置、行為預(yù)測等),決策規(guī)劃層按照駕駛決策算法將空間、時間上的獨立信息、互補信息和冗余信息進(jìn)行理解,根據(jù)實時感知到的車輛周圍環(huán)境信息,實時決策車輛可執(zhí)行的駕駛指令并規(guī)劃出行程軌跡。運動控制層接收決策規(guī)劃層的駕駛指令,控制車輛穩(wěn)定運行的同時保證車輛的控制精度。
隨機性和模糊性導(dǎo)致不確定性是人類思維活動中最基本的特性。對人類思維模擬、研究的人工智能技術(shù),也具有不確定性的特點。隨著科學(xué)技術(shù)不斷深入發(fā)展,需要學(xué)者們研究的變量越來越多,而且變量之間的關(guān)系也越來越復(fù)雜,對系統(tǒng)的判別和推理的精確性要求也越來越高。實踐告訴我們:復(fù)雜的系統(tǒng)往往難以精確化。這就使得人們對系統(tǒng)精確性的需求和問題本身的復(fù)雜性之間形成矛盾。復(fù)雜性越高,有意義的精確化能力就越低,而復(fù)雜性意味著因素眾多,使人們在求解這類復(fù)雜問題時,只能抓住問題的主要部分,忽略次要部分,而這又常常使本身明確的概念變得模糊起來,從而導(dǎo)致不確定性。
因人為主觀因素導(dǎo)致的安全問題,往往通過政府部門健全法律、法規(guī),引導(dǎo)、管理人工智能技術(shù)健康發(fā)展,本文將焦點放在因客觀技術(shù)問題引起的安全問題方面。目前,智能車的安全性問題越來越受到社會重視。國務(wù)院于2017 年發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中明確指出:“在大力發(fā)展人工智能的同時,必須高度重視可能帶來的安全風(fēng)險挑戰(zhàn),加強前瞻預(yù)防與約束引導(dǎo),最大限度降低風(fēng)險,確保人工智能安全、可靠、可控發(fā)展”[15]。基于上述原因,預(yù)期功能安全(safety of the intended functionality, SOTIF)的研究應(yīng)運而生。預(yù)期功能安全在ISO/PAS 21448 中首次給出定義[16],關(guān)注由功能不足或者由可合理預(yù)見的人員誤用所導(dǎo)致的危害和風(fēng)險。例如,傳感系統(tǒng)在暴雨、積雪等天氣情況下,傳感器本身功能未發(fā)生故障,但智能車是否仍能按預(yù)期行駛。
本文總結(jié)智能汽車研究中的環(huán)境感知算法、智能決策算法、智能化算法的不確定性以及不確定性帶來的安全問題等4 個方面的研究情況,以期引起相關(guān)研究者的關(guān)注并提供指導(dǎo)。
1 智能感知與決策在智能汽車中的應(yīng)用
智能汽車環(huán)境感知算法作為智能汽車規(guī)劃決策和控制執(zhí)行的基礎(chǔ)環(huán)節(jié),是智能汽車研究的關(guān)鍵技術(shù)之一,也是智能汽車當(dāng)前研究的熱點問題。本文對智能車中的環(huán)境感知算法進(jìn)行綜述,其次總結(jié)了當(dāng)前決策規(guī)劃層的研究情況。
1.1 基于視覺的感知算法
1) 目標(biāo)檢測算法
目標(biāo)檢測的任務(wù)是找出圖像或視頻中的感興趣物體,同時檢測出它們的位置和大小,是機器視覺領(lǐng)域的核心問題之一,至今已有將近二十年的研究歷史。作為計算機視覺的基本問題,目標(biāo)檢測構(gòu)成了許多計算機視覺任務(wù)的基礎(chǔ),目前目標(biāo)檢測算法已廣泛應(yīng)用于許多現(xiàn)實世界的應(yīng)用,如智能駕駛、機器人視覺、視頻監(jiān)控等。從2012 年開始,因大數(shù)據(jù)技術(shù)和硬件計算能力的提升,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)再一次受到研究者的關(guān)注,CNN 提取到的特征和傳統(tǒng)手工特征[17-21]相比,具有更魯棒和更深層的特性,這也引導(dǎo)研究者將CNN 應(yīng)用到目標(biāo)檢測領(lǐng)域中。用深度學(xué)習(xí)解決目標(biāo)檢測算法,可被分為兩組[22]:兩階段法和一階段法。兩階段法采用“由粗到細(xì)”的檢測策略,而一階段法利用神經(jīng)網(wǎng)絡(luò)模型,一步完成檢測任務(wù)。
R-CNN[23]是第一個將深度學(xué)習(xí)用于目標(biāo)檢測的網(wǎng)絡(luò),其訓(xùn)練過程展示了最初的兩階段法的思路:首先通過一組網(wǎng)絡(luò)提取目標(biāo)的候選框,然后每個候選框內(nèi)的圖像會縮放至相同尺度,并輸入至一個CNN 網(wǎng)絡(luò)中提取特征,最后利用SVM[24]等分類器對每個區(qū)域的特征進(jìn)行學(xué)習(xí)分類,完成檢測識別。具有代表性的工作是R-CNN,其mAP(mean average precision)指標(biāo)在VOC07 數(shù)據(jù)集上從33.7%提升至58.5%。Fast R-CNN[25]改善了R-CNN 計算冗余的問題,其在訓(xùn)練檢測器時同時回歸邊框,mAP 指標(biāo)從58.5%進(jìn)一步提升至70%,并且檢測速度比R-CNN 高近200 倍,同時Fast R-CNN 也進(jìn)一步優(yōu)化了兩階段法訓(xùn)練過程,將SVM 分類器替換為softmax 分類器,將分類過程和網(wǎng)絡(luò)訓(xùn)練融合一體。
一階段法對目標(biāo)的檢測更直接,一般采用端到端網(wǎng)絡(luò),有代表性的工作是文獻(xiàn)[26]提出的YOLO(you only look once)網(wǎng)絡(luò),這是第一個采用深度學(xué)習(xí)方案的一階段檢測網(wǎng)絡(luò),盡管YOLO 的檢測速度非常快,但和兩階段法相比,其對目標(biāo)位置的定位精度下降了,尤其是對一些小目標(biāo)。后來作者繼續(xù)在YOLO 的基礎(chǔ)上進(jìn)行改進(jìn),提出了YOLO_v2[27]和YOLO_v3[28],進(jìn)一步提升了檢測精度,在位置定位精度上也有所考慮。SSD(single shot multibox detector[29]網(wǎng)絡(luò)引入多引用和多分辨率檢測技術(shù),對小目標(biāo)的檢測精度提升明顯。
2) 車道線檢測算法
基于視覺的車道線檢測技術(shù)已經(jīng)廣泛應(yīng)用于輔助駕駛系統(tǒng),如駕駛員熟悉的私家車車道保持功能,駕駛車輛時,如果車輛壓在車道線上太久,則駕駛輔助系統(tǒng)會提醒駕駛員調(diào)整車輛位置。
近年來,基于深度學(xué)習(xí)的車道線檢測算法被引入到智能駕駛領(lǐng)域,并表現(xiàn)出強大的檢測性能。文獻(xiàn)[30]使用一個8 層的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練端到端車道線檢測模型。隨著YOLO[26]等目標(biāo)檢測網(wǎng)絡(luò)的精度和效率越來越好,研究者們逐漸把目標(biāo)檢測網(wǎng)絡(luò)引入到車道線檢測系統(tǒng)中。文獻(xiàn)[31]搭建了用于在單次正向推斷中執(zhí)行車道線檢測的CNN 模型,該模型用于回歸車道線兩個端點及其深度。然而,上述方法在車道線占比過小、遮擋等條件下檢測性能并不理想,研究者們借鑒傳統(tǒng)車道線檢測算法在消影點、車道形狀、軌跡等領(lǐng)域的研究成果[32],并將這類方法和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,一定程度上抑制了漏檢和誤檢問題。文獻(xiàn)[33]提出用15 個點對車道線進(jìn)行建模,以避免車道線邊界檢測不準(zhǔn)確。從人類感知車道環(huán)境的經(jīng)驗中得到啟發(fā),文獻(xiàn)[34]設(shè)計了多任務(wù)網(wǎng)絡(luò)來檢測車道線消影點,提高了檢測精度。文獻(xiàn)[35]設(shè)計了特征圖逐層卷積網(wǎng)絡(luò),在CNN 框架中加入像素之間的約束,學(xué)習(xí)車道線的結(jié)構(gòu)信息。
3) 目標(biāo)跟蹤算法
視覺跟蹤通過在連續(xù)的視頻圖像序列中估計感興趣目標(biāo)的位置或所在區(qū)域,結(jié)合歷史運動信息,預(yù)測其未來的運動信息,對智能車分析理解其周圍環(huán)境至關(guān)重要。在線視覺跟蹤的基本框圖如圖1所示。
圖1 視覺跟蹤基本框圖
近年來,神經(jīng)網(wǎng)絡(luò)技術(shù)借助其優(yōu)秀的特征建模能力,在目標(biāo)跟蹤領(lǐng)域取得了巨大成功。基于濾波的目標(biāo)跟蹤受關(guān)注最多,其算法核心思想是將待跟蹤目標(biāo)的模板與待搜索區(qū)域(候選區(qū)域)內(nèi)的圖像進(jìn)行相似度匹配,匹配度最高的位置即為跟蹤到的目標(biāo)圖像塊。經(jīng)深度神經(jīng)網(wǎng)絡(luò)提取到的特征和傳統(tǒng)特征相比具有更魯棒的表征能力,但是由于網(wǎng)絡(luò)的復(fù)雜性,往往無法實時提取圖像特征,因此基于濾波的深度神經(jīng)網(wǎng)絡(luò)具有實用的研究價值。文獻(xiàn)[36]設(shè)計了多層卷積網(wǎng)絡(luò)用于視覺跟蹤,認(rèn)為深層特征具有良好的語義表述能力,但其空間位置信息較弱,而淺層特征恰好彌補了這一不足,其主要思路是將不同層特征分別用于訓(xùn)練濾波器,最終在定位目標(biāo)位置時,將待搜索區(qū)域的濾波器響應(yīng)加權(quán)形成響應(yīng)圖像,最終按響應(yīng)最大值區(qū)域作為目標(biāo)所在位置。和文獻(xiàn)[36]的多層網(wǎng)絡(luò)處理方式類似,文獻(xiàn)[37]提出強化深度跟蹤算法,采用了6 層網(wǎng)絡(luò)特征代替文獻(xiàn)[36]中的3 層特征,同時將固定權(quán)重優(yōu)化為自適應(yīng)學(xué)習(xí)權(quán)重。
神經(jīng)網(wǎng)絡(luò)除了應(yīng)用于特征提取和濾波計算,還可以作為輔助網(wǎng)絡(luò)提取圖像中的顯著性區(qū)域。文獻(xiàn)[38]提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)的目標(biāo)強化跟蹤算法,使用RNN提取顯著性圖,將其和濾波器系數(shù)相融合,以增強濾波器對于背景干擾信息的抑制能力。也有文獻(xiàn)將注意力機制與濾波網(wǎng)絡(luò)相融合,提出了注意力機制相關(guān)濾波網(wǎng)絡(luò)(attentional correlation filter network,AFCN),利用注意力機制對圖像的特征和濾波器進(jìn)行選擇,判斷區(qū)域的可靠部分,進(jìn)而引導(dǎo)下一幀圖像中的目標(biāo)定位[39]。
4) 行為預(yù)測算法
行為預(yù)測功能會根據(jù)當(dāng)前以及歷史感知來預(yù)測智能車周圍其他運動物體(如其他車輛、行人、非機動車等)的未來運動軌跡。為使智能車在道路上安全有效地行駛,智能汽車不僅應(yīng)感知其周圍其他運動元素的狀態(tài),還應(yīng)主動預(yù)測其未來的運動軌跡,有助于智能車提前做出最優(yōu)決策。機器學(xué)習(xí)尤其是深度學(xué)習(xí)的最新進(jìn)展為解決智能車行為預(yù)測提供了有力工具。一般地,行為預(yù)測算法可以劃分為如下3 類解決方案:基于循環(huán)神經(jīng)網(wǎng)絡(luò)的解決方案、基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的解決方案以及其他方案。文獻(xiàn)[40]使用一組LSTMS 來建模個體車輛的軌跡;另一組用來建模對交互的作用。文獻(xiàn)[41-43]提出了多層長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)用于序列分類器。文獻(xiàn)[44]提出用于估計加速度的兩層LSTM 網(wǎng)絡(luò)。文獻(xiàn)[45]提出多個RNN 網(wǎng)絡(luò),一組LSTM 網(wǎng)絡(luò)用于建模個體車輛的軌跡,另一組網(wǎng)絡(luò)用于建立當(dāng)前智能車與其他元素的交互模型。在卷積神經(jīng)網(wǎng)絡(luò)解決方案里,文獻(xiàn)[46]提出一個包含卷積層和全連接層的6 層網(wǎng)絡(luò),用于預(yù)測周圍車輛的意圖。文獻(xiàn)[47-48]使用MobileNet V2[49]作為特征提取器,提取到的特征用來預(yù)測周圍車輛意圖。文獻(xiàn)[50]先利用兩個骨干CNN 網(wǎng)絡(luò)來提取激光雷達(dá)和柵格化地圖的特征,然后將3 個不同的網(wǎng)絡(luò)分別生成檢測、意圖和軌跡模型。也有學(xué)者把RNN 網(wǎng)絡(luò)和CNN 網(wǎng)絡(luò)相結(jié)合用于行為預(yù)測。文獻(xiàn)[51]從CNN 中提取圖像空間特征,將特征輸入到LSTM 中,最后饋送至反卷積網(wǎng)絡(luò),輸出和原始輸入同大小的預(yù)測圖。
5) 導(dǎo)航與定位
除了上面討論的感知信息外,智能車要實現(xiàn)全局路徑規(guī)劃,還需要通過定位系統(tǒng)精準(zhǔn)的知道自身在全局環(huán)境中的位置。即時定位與建圖(simultaneous localization and mapping, SLAM)技術(shù)借助視覺傳感器、慣性測量單元(inertial measurement unit, IMU)等傳感器設(shè)備,在智能車駕駛的過程中完成全局地圖的構(gòu)建,同時定位出自身在全局地圖中的位置。總結(jié)SLAM 的研究歷史,其研究思路可以歸納為兩類:基于擴(kuò)展卡爾曼濾波的SLAM 框架[52-53]以及基于圖優(yōu)化的SLAM 框架[54-58]。
擴(kuò)展卡爾曼濾波算法是卡爾曼濾波算法在非線性系統(tǒng)下的推廣,基于擴(kuò)展卡爾曼濾波的SLAM框架較簡單,且較容易適配多傳感器融合,因此這類SLAM 框架運算效率一般都較快,但由于其相機參數(shù)是依靠濾波估計得出的,故無法得到精確、平滑的相機姿態(tài)。基于圖優(yōu)化的SLAM 框架避免了借助圖優(yōu)化理論,前端完成相機跟蹤,確定定位任務(wù),后端實現(xiàn)建圖與地圖優(yōu)化,后端一般會將相機姿態(tài)和地圖優(yōu)化至局部或全局最優(yōu)處,因而基于圖優(yōu)化的SLAM 跟蹤到的相機軌跡會比較平滑,地圖也更精細(xì)。PTAM[54]是第一個可以接近實時運行的圖優(yōu)化SLAM 框架,其基本思想是前端利用跟蹤算法完成相機的位姿跟蹤,當(dāng)前端觸發(fā)關(guān)鍵幀(key frame)生成條件時,激活后端建圖任務(wù)。ORB-SLAM 將前端跟蹤算法替換為ORB 描述符[20],并提供了可以商業(yè)化的開源代碼[59],不過由于ORB-SLAM 使用的是稀疏特征點,建立的地圖也是稀疏的。SVO[57]、DSO[56]為半稠密地圖、稠密地圖提供了解決方案。為了適應(yīng)一些復(fù)雜環(huán)境,多傳感器融合也經(jīng)常應(yīng)用到SLAM 中,視覺傳感器和IMU 組合使用可以解決純視覺SLAM 在估計深度時容易出現(xiàn)誤差的問題。VINS[58]成功的融合了視覺和IMU,能夠長時在戶外建立大規(guī)模地圖。
回環(huán)檢測用于判斷智能車是否曾經(jīng)到訪過當(dāng)前所處的位置。在智能車三維重建周圍環(huán)境的過程中,由于累計數(shù)值誤差的存在,導(dǎo)致尺度漂移是SLAM 至今為止都未完全攻克的問題。閉環(huán)檢測可以減弱累計誤差對整個三維重建過程的影響,增加收斂性。在傳統(tǒng)機器學(xué)習(xí)時代,大量的方法使用詞袋模型[60](bag of words, BoW)實現(xiàn)閉環(huán)檢測。近年來,以深度學(xué)習(xí)為代表的方法得到很多研究者的關(guān)注,這類方法以圖像檢索的思路解決回環(huán)檢測任務(wù),文獻(xiàn)[61]首次用神經(jīng)網(wǎng)絡(luò)從視覺地點識別的角度建立網(wǎng)絡(luò)模型。受BoW 和神經(jīng)網(wǎng)絡(luò)啟發(fā),NetVLAD[62]利用網(wǎng)絡(luò)學(xué)習(xí)類別中心殘差系數(shù),大幅提升了檢索性能,研究視覺地點識別的還有文獻(xiàn)[63-66]。
1.2 決策算法
決策算法設(shè)計的目的是在駕駛決策過程中引入高級認(rèn)知能力,進(jìn)而能駕馭復(fù)雜駕駛環(huán)境,其研究可以追溯至20 世紀(jì)80 年代,智能車決策算法可以分為3 類:基于行為認(rèn)知的方法、基于數(shù)據(jù)挖掘的方法和基于機器學(xué)習(xí)的方法。
基于行為認(rèn)知的決策方法模仿、加工人類對事物的認(rèn)知和抽象能力,形成可供智能車識別、執(zhí)行的決策規(guī)則。研究思路是根據(jù)交通法律法規(guī)、人類駕駛經(jīng)驗建立駕駛決策規(guī)則庫,在不同的駕駛環(huán)境下,按照規(guī)則庫中的邏輯確定車輛駕駛行為[67]。這種方法在封閉道路環(huán)境下能夠很好的完成決策任務(wù),但智能車面臨的駕駛環(huán)境是開放的,往往無法預(yù)估,因此這種方法在實際研究中應(yīng)用有限。普林斯頓大學(xué)利用知覺匹配來設(shè)計智能決策算法,借助深度學(xué)習(xí)技術(shù),將輸入圖像和關(guān)鍵的知覺指標(biāo)進(jìn)行匹配,通過基于車輛動力學(xué)模型決策駕駛行為。卡耐基梅隆大學(xué)在設(shè)計決策算法時采用了行為推理的方式[68]。文獻(xiàn)[69-70]使用貝葉斯方法對駕駛員數(shù)據(jù)進(jìn)行分析,使車輛能夠在車道數(shù)減少時對車流匯入情形下的車輛意圖進(jìn)行預(yù)測。
基于數(shù)據(jù)挖掘的決策方法利用大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)進(jìn)行清洗、分析、特征提取、挖掘數(shù)據(jù)背后的價值內(nèi)容(如駕駛經(jīng)驗、判斷知識等),并將挖掘到的內(nèi)容形式化成智能車可以執(zhí)行的決策指令。這類方法對數(shù)據(jù)規(guī)模依賴較大,研究中往往數(shù)據(jù)不足成為影響決策算法性能的瓶頸。文獻(xiàn)[71]建立了用于預(yù)測換道時的決策行為的隱馬爾科夫模型。
基于機器學(xué)習(xí)的決策方法是目前研究的熱點,這類方法借助人工智能技術(shù),從人類思維的源頭出發(fā)模擬人類,借助強大的硬件處理能力以及神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)能力,通過在實際駕駛環(huán)境或仿真駕駛環(huán)境中的大量訓(xùn)練,使智能汽車自主的學(xué)習(xí)到正確的駕駛決策指令。北京理工大學(xué)構(gòu)建了換道規(guī)則數(shù)據(jù)庫,該工作首先進(jìn)行人工數(shù)據(jù)標(biāo)定,再利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)利用規(guī)則數(shù)據(jù)庫換道規(guī)則。該研究成果在比亞迪自動駕駛平臺上驗證測試,測試結(jié)果和人類駕駛員的駕駛決策相比,相似度高達(dá)80.4%[72]。工業(yè)界也在智能決策領(lǐng)域做了大量的工作,科技巨頭如谷歌、百度、小鵬、Drive.ai 等企業(yè)用人工智能技術(shù)來解決決策問題,一般采用端到端的方式,從環(huán)境感知開始,使用深度學(xué)習(xí)模型直接對智能車行為進(jìn)行決策,以期實現(xiàn)用駕駛腦代替人類大腦。
2 智能算法的不確定性推理
霍金曾指出不確定性是我們在其中生活的宇宙的一個基本特征[73]。隨著智能技術(shù)研究的深入,智能技術(shù)的研究對象—人類智能的不可形式化形象思維成為智能技術(shù)發(fā)展的瓶頸。盡管當(dāng)前的計算機軟硬件技術(shù)擁有強大的計算、存儲和搜索能力,但對于非形式化問題卻難以下手。在人工智能技術(shù)的研究過程中,考慮確定性因素對真實世界進(jìn)行模擬,抓住主要部分,忽略次要部分。因此,在智能技術(shù)的研究中,考慮真實世界的不確定性因素,是模擬、延伸人類智能必不可少的環(huán)節(jié)。
從1956 年的達(dá)特茅斯會議上“人工智能”正式被提出以來[74],發(fā)展僅有60 余年的歷史。學(xué)者們往往將人工智能技術(shù)與哲學(xué)、腦科學(xué)、計算機技術(shù)、心理學(xué)等學(xué)科聯(lián)系在一起研究,這也導(dǎo)致了人工智能算法的不確定性反應(yīng)在諸多方面。如從哲學(xué)的角度推理人工智能算法的認(rèn)知不確定性問題[75],從腦科學(xué)的角度推理人工智能的內(nèi)在生成機制的不確定性問題[76]。本文由于篇幅有限,且將討論聚焦在計算機技術(shù)角度,即主要討論人工智能技術(shù)研究的不確定性問題。
1) 信息獲取的不確定性
盡管人類利用多種感覺器官(如視覺、聽覺、嗅覺、觸覺等)獲取信息,然而仍然不能把握全部信息。Shannon 信息論指出:信息是消除不確定性的東西[77]。但是在人類主體篩選信息的過程中已經(jīng)出現(xiàn)了不確定性。在智能車中,主流的信息獲取依靠各類傳感器來模擬人類感官,如視覺攝像頭模擬人眼,麥克風(fēng)和揚聲器分別模擬耳朵和嘴巴。各種傳感器的設(shè)計和人類主體感覺器官之間又進(jìn)一步增大了信息獲取的不確定性。
2) 信息理解的不確定性
信息理解是人類大腦對信息的加工和理解過程。盡管在信息獲取階段已經(jīng)引入不確定性信息,但這部分信息對于人工智能算法依然足夠豐富。在人工智能算法的研究過程中,由于原始特征和存儲能力、計算能力之間的矛盾,研究者們往往會對信息進(jìn)行加工,提取最具代表原始信息的特征。如利用智能算法取得巨大成功的圖像識別領(lǐng)域,往往不會利用原始圖像作為特征進(jìn)行評比,而是對原始圖像進(jìn)行加工、處理;主成分分析(principal component analysis, PCA)也是信息加工常用的技術(shù)手段[78]。這種智能算法中的常見技術(shù)手段也會引入不確定性。
3) 主體決策的不確定性
在從信息獲取、理解到智能決策的過程中,主體往往從多個方案中選擇一個最優(yōu)的,從形式上看,這是一個概率問題,必然伴隨著不確定性。智能策略的生成離不開對問題的充分分析和對環(huán)境信息的充分理解,同一智能主體在不同時刻、不同環(huán)境的情況下,可能做出迥異的決策。
3 算法不確定性對安全的影響
隨著駕駛輔助系統(tǒng)(advanced driver assistance systems, ADAS)越來越復(fù)雜,盡管引入的各種復(fù)雜傳感器(如激光雷達(dá)、超聲波雷達(dá))在一定程度上彌補了信息獲取的不確定性,但是卻增加了信息理解的難度,導(dǎo)致智能車的預(yù)期功能在某些情況下無法達(dá)到要求。2018 年3 月,Uber 自動駕駛汽車在美國意外撞擊致死一名行人,在所有傳感系統(tǒng)正常工作的情形下,行人被識別成未知物體,導(dǎo)致悲劇發(fā)生。基于上述背景,預(yù)期功能安全應(yīng)運而生。
3.1 預(yù)期功能安全
預(yù)期功能安全的定義首次在2015 年被提出,ISO/PAS 21448 標(biāo)準(zhǔn)將預(yù)期功能安全定義為:由功能不足、或由可合理預(yù)見的人員誤用所導(dǎo)致的危害和風(fēng)險[16]。例如,傳感系統(tǒng)在暴雨、積雪等天氣情況下,本身并未發(fā)生故障,但是否仍能執(zhí)行預(yù)期功能。
預(yù)期功能安全基于場景來進(jìn)行分析,ISO/PAS 21448 標(biāo)準(zhǔn)將場景劃分為如圖2 所示的4 個區(qū)間,分別為:1)已知-安全場景;2)已知-危險場景;3)未知-危險場景;4)未知-安全場景。預(yù)期功能安全研究的目的是將已知危險區(qū)域和未知危險區(qū)域縮小至可接收的范圍內(nèi),即保證場景盡可能控制在安全區(qū)域。
圖2 ISO/PAS 21448 對場景的劃分
3.2 預(yù)期功能安全研究進(jìn)展
當(dāng)前對智能駕駛汽車預(yù)期功能的安全研究尚處于起步階段。ISO/PAS 21448 規(guī)范了預(yù)期功能安全的基本實現(xiàn)思路和流程[16],為預(yù)期功能安全的研究工作提供了指導(dǎo)性研究思路。
研究者在場景的理解領(lǐng)域做了大量工作。文獻(xiàn)[79]把物理對象的空間-時間排列當(dāng)做場景。文獻(xiàn)[80]認(rèn)為場景包含環(huán)境的動態(tài)元素以及一些指定的駕駛指令,用場景片段的思路分析預(yù)期功能安全問題,場景的起點是前一場景的終點。文獻(xiàn)[81]提出場景樹的思想,將場景分解為簡單元素并用樹狀結(jié)構(gòu)排列。文獻(xiàn)[82]總結(jié)了前人的研究成果,將環(huán)境的快照信息,如動態(tài)元素(如車、人等)、靜態(tài)元素(建筑、風(fēng)景等)以及這些實體之間的關(guān)系定義為場景。
除了對場景理解的研究工作外,文獻(xiàn)[83]梳理了信息安全、功能安全和預(yù)期功能安全三者之間的聯(lián)系和區(qū)別。文獻(xiàn)[84]報告了功能安全和預(yù)期功能安全之間的關(guān)系。文獻(xiàn)[85]深入分析了預(yù)期功能安全研究的挑戰(zhàn),并提出了相應(yīng)的風(fēng)險評估框架。
在預(yù)期功能理論和定性定量方面也得到了學(xué)者的關(guān)注。博世公司借助V 模型把預(yù)期功能安全用于ADAS 系統(tǒng)的開發(fā)過程,并利用性能故障樹分析DA/AD 系統(tǒng)[86]。TNO 融合場景和數(shù)據(jù)驅(qū)動,提出了用于構(gòu)建和維護(hù)真實場景數(shù)據(jù)庫的StreetWise方法,為智能駕駛提供了真實的測試場景用例[87]。文獻(xiàn)[88]為預(yù)期功能安全測試提供了參考,提出了一些新的貝葉斯停止規(guī)則。文獻(xiàn)[89]將信息論中熵的概念引入到預(yù)期功能安全研究中,引入安全熵的概念,提出基于安全熵的預(yù)期功能安全度的量化分析方法。
3.3 預(yù)期功能安全應(yīng)用
MIT 認(rèn)為自動駕駛應(yīng)該分為兩個等級:人機共駕(shared autonomy)以及全自動駕駛(full autonomy)[90]。這樣的分類方式為研究者提供了指導(dǎo)方針,在研究過程中添加必要的限制條件有助于研究工作的順利開展。完全自動駕駛無人的智能汽車要解決預(yù)期功能的安全問題,該時機尚未成熟,因此人機共駕是一個和現(xiàn)實研究情況很契合的路線。
在傳統(tǒng)汽車駕駛中,人作為控制車輛的主體,具有高度的智能性,智能汽車的目標(biāo)是要用計算機代替?zhèn)鹘y(tǒng)的駕駛員。然而在智能算法的研究進(jìn)程中,從目前的研究進(jìn)展看,無論是采用何種傳感器、算法多么魯棒,都無法100%彌補智能算法的不確定性因素,如果在智能車行駛的極端條件下輔以人類智慧,利用人類智慧彌補智能算法的不確定性,是值得關(guān)注的研究方向。
人機共駕通常被分為3 個層次:信息感知層的人機交互、規(guī)劃決策層的人機協(xié)同以及執(zhí)行控制層的人機交互[91]。信息感知層人機交互主要依靠人的感官系統(tǒng)對智能車的感知器進(jìn)行補充,從而彌補智能算法信息獲取的不確定性問題。規(guī)劃決策層的人機協(xié)同彌補了信息理解和主體決策的不確定性,由于智能車系統(tǒng)是非線性系統(tǒng),智能算法求解的絕大多數(shù)最優(yōu)解僅僅是局部最優(yōu)解,輔以人類決策,如轉(zhuǎn)彎、速度控制等。執(zhí)行控制層人機交互則是借助人類經(jīng)驗和智能控制算法對智能汽車進(jìn)行精確控制。
4 結(jié)束語
本文首先從智能感知、智能決策兩個角度總結(jié)了智能算法在智能汽車領(lǐng)域的應(yīng)用和研究進(jìn)展。其次,還從信息獲取、信息理解、智能決策3 個角度分析了智能算法研究的不確定性特性,并介紹了解決因智能算法不確定性帶來的安全問題的研究方法—預(yù)期功能安全,并總結(jié)了預(yù)期功能安全的研究情況,最后總結(jié)了用于實現(xiàn)預(yù)期功能安全的人機共駕方案的研究情況。
參 考 文 獻(xiàn)
[1] 常周林, 袁婷. 人工智能在智能機器人系統(tǒng)中的應(yīng)用研究[J]. 科技創(chuàng)新導(dǎo)報, 2016, 13(23): 10.CHANG Zhou-lin, YUAN Ting. Application of artificial intelligence in intelligent robot system[J]. Science and Technology Innovation Herald, 2016, 13(23): 10.
[2] ZHANG Y, WILLIAM C, NAVDEEP J. Very deep convolutional networks for end-to-end speech recognition[C]//IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). [S. l.]:IEEE, 2017: 4845-4849.
[3] SAINATH T N, MOHAMED A R, BRIAN K, et al. Deep convolutional neural networks for LVCSR[C]//IEEE International Conference on Acoustics, Speech and Signal Processing. [S. l.]: IEEE, 2013: 8614-8618.
[4] ALEX K, SUTSKEVER I, GEOFFREY E H. Imagenet classification with deep convolutional neural networks[C]//Advances in Neural Information Processing Systems. [S. l.]:IEEE, 2012: 1097-1105.
[5] KAREN S, ANDREW Z. Very deep convolutional networks for large-scale image recognition[C]//The 3rd International Conference on Learning Representations.[S.l.]: [s.n.], 2015:1884-2020.
[6] HE Kai-ming, ZHANG Xiang-yu, REN Shao-qing, et al.Deep residual learning for image recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S. l.]: IEEE, 2016: 770-778.
[7] CHRISTIAN S, LIU Wei, JIA Yang-qing, et al. Going deeper with convolutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.[S. l.]: IEEE, 2015: 1-9.
[8] ZHANG Wei-nan, ZHU Qing-fu, WANG Yi-fa, et al.Neural personalized response generation as domain adaptation[J]. World Wide Web, 2019(4): 1427-1446.
[9] TAO Chong-yang, MOU Li-li, ZHAO Dong-yan, et al.Ruber: An unsupervised method for automatic evaluation of open-domain dialog systems[EB/OL]. [2018-11-12]. https://arxiv.org/abs/1701.03079.
[10] 志剛. 什么是人工智能[J]. 大眾科學(xué), 2018(1): 44-45.ZHI Gang. What is AI[J]. China Public Science, 2018(1):44-45.
[11] 王家祺, 王賽. 人工智能技術(shù)的發(fā)展趨勢探討[J]. 通訊世界, 2017(16): 1006-4222.WANG Jia-qi, WANG Sai. Discussion on the development trend of artificial intelligence technology[J].Telecom World, 2017(16): 1006-4222.
[12] 崔雍浩, 商聰, 陳鍶奇. 人工智能綜述: AI 的發(fā)展[J]. 無線電通信技術(shù), 2019, 45(3): 5-11.CUI Yong-hao, SHANG Cong, CHEN Tian-qi. A review of artificial intelligence: The development of AI[J]. Radio Communication Technology, 2019, 45(3): 5-11.
[13] 韓曄彤. 人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J]. 電子制作, 2016, DOI: 10.3969/j.issn.1006-5059.2016.12.082.HAN Ye-tong. Development and application of artificial intelligence technology[J]. Electronic Production, 2016,DOI: 10.3969/j.issn.1006-5059.2016.12.082.
[14] 李開復(fù), 王詠剛. 到底什么是人工智能[J]. 科學(xué)大觀園,2018(2): 48-49.LI Kai-fu, WANG Yong-gang. What is artificial intelligence[J]. Science Grand View Park, 2018(2): 48-49.
[15] 中國國務(wù)院. 新一代人工智能發(fā)展規(guī)劃[J]. 科技導(dǎo)報,2017(17): 113.State Council of China. New generation artificial intelligence development plan[J]. Science & Technology Review, 2017(17): 113.
[16] LI Bo. Road vehicles-Safety of the intended functionality[J]. China Auto, 2019(4): 20-22.
[17] DALAL N, Bill T. Histograms of oriented gradients for human detection[C]//In 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR). [S.l.]: IEEE, 2005: 886-893.
[18] LOWE D G. Distinctive image features from scaleinvariant keypoints[J]. International Journal of Computer Vision, 2004(2): 91-110.
[19] BAY H, TINNE T, LUC V G. Surf: Speeded up robust features[C]//European Conference on Computer Vision.[S. l.]: Springer, 2006: 404-417.
[20] RUBLEE E, VINCENT R, KURT K, et al. ORB: An efficient alternative to SIFT or SURF[C]//International Conference on Computer Vision. [S.l.]: IEEE, 2011: 2564-2571.
[21] CALONDER M, VINCENT L, CHRISTOPH S, et al.Brief: Binary robust independent elementary features[C]//European Conference on Computer Vision. [S.l.]: Springer,2010: 778-792.
[22] ZOU Zheng-xia, SHI Zhen-wei, GUO Yu-hong, et al.Object detection in 20 years: A survey[EB/OL]. [2019-10-25]. https://arxiv.org/abs/1905.05055v2.
[23] ROSS G, JEFF D, TREVOR D, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE,2014: 580-587.
[24] SUYKENS J A K, JOOS V. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999(3):293-300.
[25] ROSS G. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. [S.l.]:IEEE, 2015: 1440-1448.
[26] REDMON J, SANTOSH D, ROSS G, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and pattern Recognition. [S.l.]: IEEE, 2016: 779-788.
[27] REDMON J, ALI F. YOLO9000: Better, faster,stronger[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE,2017: 7263-7271.
[28] REDMON J, ALI F Yolov3: An incremental improvement[R]. Washington: University of Washington,2018.
[29] LIU W, DRAGOMIR A, DUMITRU E, et al. Ssd: Single shot multibox detector[C]//European Conference on Computer Vision. [S.l.]: Springer, 2016: 21-37.
[30] KIM J, MINHO L. Robust lane detection based on convolutional neural network and random sample consensus[C]//International Conference on Neural Information Processing. [S.l.]: Springer, 2014: 454-461.
[31] HUVAL B, WANG T, SAMEEP T, et al. An empirical evaluation of deep learning on highway driving[EB/OL].[2019-11-10]. https://arxiv.org/abs/1504.01716.
[32] 方睿. 基于視覺的車道線檢測技術(shù)綜述[J]. 內(nèi)江科技,2018(7): 41-42.FANG Rui. Overview of vision based lane detection technology[J]. Neijiang Technology, 2018(7): 41-42.
[33] CHOUGULE S, NORA K, ASAD I, et al. Reliable multilane detection and classification by utilizing CNN as a regression network[C]//Proceedings of the European Conference on Computer Vision. [S.l.]: Springer, 2018:740-752.
[34] LEE S, JUNSIK K, JAE S Y, et al. Vpgnet: Vanishing point guided network for lane and road marking detection and recognition[C]//Proceedings of the IEEE International Conference on Computer Vision. [S.l.]: IEEE, 2017: 1947-1955.
[35] PAN Xin-gang, SHI Jian-ping, LUO Ping, et al. Spatial as deep: Spatial cnn for traffic scene understanding[EB/OL].[2019-11-27]. https://arxiv.org/abs/1712.06080.
[36] MA Chao, HUANG Jia-Bin, YANG Xiao-kang, et al.Hierarchical convolutional features for visual tracking[C]//Proceedings of the IEEE International Conference on Computer Vision. [S.l.]: IEEE, 2015: 3074-3082.
[37] QI Yuan-kai, ZHANG Sheng-ping, LEI Qin, et al. Hedged deep tracking[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE,2016: 4303-4311.
[38] GLADH S, MARTIN D, FAHAD S K, et al. Deep motion features for visual tracking[C]//The 23rd International Conference on Pattern Recognition. [S.l.]: IEEE, 2016:1243-1248.
[39] CHOI J, CHANG H J, YUN S, et al. Attentional correlation filter network for adaptive visual tracking[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S. l.]: IEEE, 2017: 4807-4816.
[40] Dai S, LI L, LI Z. Modeling vehicle interactions via modifified LSTM models for trajectory prediction[J].IEEE Acess, 2019, 7: 287-296.
[41] ALEX Zyner, STEWART W, EDUARDO N. A recurrent neural network solution for predicting driver intention at unsignalized intersections[J]. IEEE Robotics and Automation Letters, 2018(3): 1759-1764.
[42] ALEX Z, STEWART W, JAMES W, et al. Long short term memory for driver intent prediction[C]//2017 IEEE Intelligent Vehicles Symposium (IV). [S.l.]: IEEE, 2017:1484-1489.
[43] PHILLIPS D J, WHEELER T A, MYKEL J K.Generalizable intention prediction of human drivers at intersections[C]//2017 IEEE Intelligent Vehicles Symposium (IV). [S. l.]: IEEE, 2017: 1665-1670.
[44] DING W C, SHEN S J. Online vehicle trajectory prediction using policy anticipation network and optimization-based context reasoning[C]//2019 International Conference on Robotics and Automation(ICRA). [S.l.]: IEEE, 2019: 9610-9616.
[45] DAI S Z, LI L, LI Z H. Modeling vehicle interactions via modified LSTM models for trajectory prediction[J]. IEEE Access, 2019(7): 38287-38296.
[46] LEE D, KWON Y P, SARA M, et al. Convolution neural network-based lane change intention prediction of surrounding vehicles for ACC[C]//2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC). [S.l.]: IEEE, 2017: 1-6.
[47] CUI H G, VLADAN R, CHOU F C, et al. Multimodal trajectory predictions for autonomous driving using deep convolutional networks[C]//2019 International Conference on Robotics and Automation (ICRA). [S.l.]: IEEE, 2019:2090-2096.
[48] DJURIC N, VLADAN R, CUI H G, et al. Motion prediction of traffic actors for autonomous driving using deep convolutional networks[EB/OL]. [2019-10-20].https://arxiv.org/abs/1808.05819v1.
[49] SANDLER M, ANDREW H, ZHU M L, et al.Mobilenetv2: Inverted residuals and linear bottlenecks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2018: 4510-4520.
[50] CASAS S, LUO W J, RAQUEL U. Intentnet: Learning to predict intention from raw sensor data[C]//Conference on Robot Learning. [S.l.]: [s. n.], 2018: 947-956.
[51] SCHREIBER M, STEFAN H, KLAUS D. Long-term occupancy grid prediction using recurrent neural networks[C]//2019 International Conference on Robotics and Automation (ICRA). [S. l.]: IEEE, 2019: 9299-9305.
[52] HUANG S D, GAMINI D. Convergence and consistency analysis for extended Kalman filter based SLAM[J]. IEEE Transactions on Robotics, 2007, 23(5): 1036-1049.
[53] LI Jian, LI Qing, CHENG Nong. A combined visualinertial navigation system of MSCKF and EKF-SLAM[C]//2018 IEEE CSAA Guidance, Navigation and Control Conference (CGNCC). [S.l.]: IEEE, 2018: 1-6.
[54] KLEIN G, DAVID M. Parallel tracking and mapping for small AR workspaces[C]//2007 6th IEEE and ACM International Symposium on Mixed and Augmented Reality. [S.l.]: IEEE, 2007: 225-234.
[55] RAUL M A, JOSE M M M, TARDOS J D. ORB-SLAM:A versatile and accurate monocular SLAM system[J].IEEE Transactions on Robotics, 2015, 31(5): 1147-1163.
[56] ENGEL J, KOLTUN V, CREMERS D. Direct sparse odometry[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(3): 611-625.
[57] ENGEL J, JURGEN S, DANIEL C. Semi-dense visual odometry for a monocular camera[C]//Proceedings of the IEEE International Conference on Computer Vision. [S.l.]:IEEE, 2013: 1449-1456.
[58] QIN T, LI P L, SHEN S J. Vins-mono: A robust and versatile monocular visual-inertial state estimator[J]. IEEE Transactions on Robotics, 2018, 34(4): 1004-1020.
[59] RAúL M A. ORB_SLAM open source[EB/OL]. [2019-11-10]. http://webdiis.unizar.es/~raulmur/orbslam/.
[60] LI T, MEI T, KWEON I S, et al. Contextual bag-of-words for visual categorization[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2010, 21(4): 381-392.
[61] CHEN Z T, OBADIAH L, ADAM J, et al. Convolutional neural network-based place recognition[EB/OL]. [2019-11-22]. https://arxiv.org/abs/1411.1509.
[62] RELJA A, PETR G, AKIHIKO T, et al. NetVLAD: CNN architecture for weakly supervised place recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2016: 5297-5307.
[63] KIM H J, ENRIQUE D, FRAHM J M. Learned contextual feature reweighting for image geo-localization[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). [S.l.]: IEEE, 2017: 3251-3260.
[64] ZHU Y Y, WANG J, XIE L X, et al. Attention-based pyramid aggregation network for visual place recognition[C]//Proceedings of the 26th ACM International Conference on Multimedia. [S.l.]: ACM, 2018: 99-107.
[65] LIU L, LI H D, DAI Y C. Deep stochastic attraction and repulsion embedding for image based localization[EB/OL].[2019-11-12]. https://arxiv.org/abs/1808.08779v2.
[66] LOWRY S, NIKO S, PAUL N, et al. Visual place recognition: A survey[J]. IEEE Transactions on Robotics,2015, 32(1): 1-19.
[67] DANIL P. Computational intelligence in automotive applications[M]. [S.l.]: Springer, 2008.
[68] BALAKIRSKY S B. A framework for planning with incrementally created graphs in attributed problem spaces[M]. [S.l.]: IOS Press, 2003.
[69] KUMAR P, MATHIAS P, STéPHANIE L, et al.Learning-based approach for online lane change intention prediction[C]//2013 IEEE Intelligent Vehicles Symposium(IV). [S.l.]: IEEE, 2013: 797-802.
[70] YAMADA K, HIROSHI M, KAZUHIRO U. A method for analyzing interaction of driver intention through vehicle behavior when merging[C]//2014 IEEE Intelligent Vehicles Symposium Proceedings. [S.l.]: IEEE, 2014:158-163.
[71] NISHIWAKI Y, CHIYOMI M, NORIHIDE K, et al.Generating lane-change trajectories of individual drivers[C]//2008 IEEE International Conference on Vehicular Electronics and Safety. [S.l.]: IEEE, 2008: 271-275.
[72] 袁盛玥. 自動駕駛車輛城區(qū)道路環(huán)境換道行為決策方法研究[D]. 北京: 北京理工大學(xué), 2016.YUAN Sheng-yue. Research on the decision-making method of road environment changing behavior of autonomous vehicles in urban areas[D]. Beijing: Beijing University of Technology, 2016.
[73] STEPHEN H. A brief history of time: From big bang to black holes[M]. [S. l.]: Random House, 2009.
[74] WANG Yan-peng, HAN Tao, WANG Xue-zhao. The development trend of artificial intelligence in the group 20[J]. Science Focus, 2019, 14(1): 20-32.
[75] 張昕. 人工智能中的不確定性問題研究[D]. 湖南: 國防科學(xué)技術(shù)大學(xué), 2012.ZHANG Xin. Research on uncertainty in artificial intelligence[D]. HuNan: National University of Defense Science and Technology, 2012.
[76] 駱清銘. 腦空間信息學(xué)—連接腦科學(xué)與類腦人工智能的橋梁[J]. 中國科學(xué): 生命科學(xué), 2017(47): 1015-1024.LUO Qing-ming. Brain spatial informatics-a bridge between brain science and brain like artificial intelligence[J]. Chinese Science: Life Science, 2017(47):1015-1024.
[77] SERGIO V. Fifty years of Shannon theory[J]. IEEE Transactions on Information Theory, 1998, 44(6): 2057- 2078.
[78] SVANTE W, KIM E, PAUL G. Principal component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 1987(2): 37-52.
[79] MAURER Markus. EMS-vision: Knowledge representation for flexible automation of land vehicles[C]//Proceedings of the IEEE Intelligent Vehicles Symposium. [S. l.]: IEEE,2000: 575-580.
[80] GEYER S, MARCEL B, BENJAMIN F, et al. Concept and development of a unified ontology for generating test and use-case catalogues for assisted and automated vehicle guidance[J]. IET Intelligent Transport Systems, 2013,8(3): 183-189.
[81] THOMASON M G, Gonzalez R C. Data structures and databases in digital scene analysis[C]//Advances in Information Systems Science. Boston: Springer, 1985: 1-47.
[82] ULBRICH S, TILL M, ANDREAS R, et al. Defining and substantiating the terms scene, situation, and scenario for automated driving[C]//2015 IEEE 18th International Conference on Intelligent Transportation Systems. [S.l.]:IEEE, 2015: 982-988.
[83] 毛向陽, 尚世亮, 崔海峰. 自動駕駛汽車安全影響因素分析與應(yīng)對措施研究[J]. 上海汽車, 2018(1): 33-37.MAO Xiang-yang, SHANG Shi-liang, CUI Hai-feng.Auto driving vehicle safety impact factors analysis and countermeasures[J]. Shanghai Motor, 2018(1): 33-37.
[84] MIRKO C. Automated driving: Challenges in the interplay between functional safety and safety of the intended functionality[M]. Berlin: [s.n.], 2018.
[85] JOHN B. Safety argument framework for highly automated vehicles[EB/OL]. [2019-09-12]. http://safety.addalot.se/upload/2017/2-6-2%20JohnBirch.pdf.
[86] SUSANNE E. Bosch case study: Application of SOTIF for ADAS[EB/OL]. [2019-09-15]. https://www.automotiveiq.com/events-sotif-conference-usa/downloads/partnercontent-robert-bosch-a-case-study-application-of-sotif-foradas.
[87] ELROFAI H, PAARDEKOOPER J P, ERWIN D G, et al.Scenario-based safety validation of connected and automated driving[EB/OL]. [2019-11-10]. https://publica tions.tno.nl/publication/34626550/AyT8Zc/TNO-2018-streetwise.pdf.
[88] BEV L, DAVID W. Some conservative stopping rules for the operational testing of safety critical software[J]. IEEE Transactions on software Engineering, 1997, 23(11): 673-683.
[89] 車天偉, 馬建峰, 王超, 等. 基于安全熵的多級訪問控制模型量化分析方法[J]. 華東師范大學(xué)學(xué)報 (自然科學(xué)版), 2015(1): 172.CHE Tian-wei, MA Jian-feng, WANG Chao, et al.Quantitative analysis method of multilevel access control model based on security entropy[J]. Journal of East China Normal University (Natural Science Edition), 2015(1):172.
[90] LEX F. Human-centered autonomous vehicle systems:Principles of effective shared autonomy[EB/OL]. [2019-12-10]. https://arxiv.org/abs/1810.01835.
[91] 胡云峰, 曲婷, 劉俊, 等. 智能汽車人機協(xié)同控制的研究現(xiàn)狀與展望[J]. 自動化學(xué)報, 2019(7): 1261-1280.HU Yun-feng, QU Ting, LIU Jun, et al. Research status and prospect of human-machine cooperative control of intelligent vehicles[J]. Journal of Automatic Chemistry,2019(7): 1261-1280.
· 復(fù)雜性科學(xué) ·
A Survey: Artificial Intelligence and its Security in Intelligent Vehicle
ZHAI Qiang1*, CHENG Hong1, HUANG Rui1, ZHAN Hui-qin1, ZHAO Yang1, and LI Jun2
(1. Center for Robotics, University of Electronic Science and Technology of China Chengdu 611731;2. School of Vehicle and Mobility, Tsinghua University Haidian Beijing 100091)
Abstract With the development of artificial intelligence (AI) technology, intelligent systems, such as intelligent driving cars and intelligent robots, gradually replace or assist human beings to do simple or complex work in various scenes. Starting from the intelligent algorithm in intelligent vehicle, this paper summarizes the research progress of artificial intelligence perception algorithm and decision algorithm in intelligent vehicle.Secondly, the uncertainty of intelligent algorithm is discussed. Finally, from the point of view of the security problems brought by the uncertainty of the intelligent algorithm, this paper discusses the significance and development of the expected functional security, and discusses the necessity of human-computer co driving to solve the expected functional security of the current intelligent driving vehicle.
Key words AI; human-computer co-driving; intelligent driving; SOTIF; statistical pattern recognition
中圖分類號 TP929.5
文獻(xiàn)標(biāo)志碼 A
doi:10.12178/1001-0548.2020179
收稿日期:2020 - 02 - 10;修回日期:2020 - 04 - 01
基金項目:國家自然科學(xué)基金(U1964203)
作者簡介:翟強(1990 - ),博士生,主要從事計算機視覺方面的研究. E-mail:287187465@qq.com
工程師必備
- 項目客服
- 培訓(xùn)客服
- 平臺客服
TOP




















