強(qiáng)化學(xué)習(xí)算法20分鐘內(nèi)可教會車輛車道保持

據(jù)外媒報(bào)道,英國Wayve公司的一組研究人員在短短20分鐘內(nèi)就教會了一輛自動駕駛汽車保持在自己的車道上行駛,考慮到一些人類駕駛員窮盡一生都無法做到保持在自己的車道上行駛,此舉令人印象深刻。
除了路怒癥(road rage)之外,Wayve公司團(tuán)隊(duì)還詳細(xì)介紹了其“強(qiáng)化學(xué)習(xí)”算法,該算法與人類安全駕駛員一起,在“15至20分鐘內(nèi)”教會了自動駕駛汽車如何保持在車道內(nèi)行駛。Wayve是一家由劍橋大學(xué)工程部的研究員創(chuàng)建的公司。
之前,DeepMind Technologies公司就通過展示強(qiáng)化學(xué)習(xí)人工智能如何學(xué)習(xí)玩圍棋(Go)或象棋(Chess)等游戲,證明其高效性。

Wayve團(tuán)隊(duì)在其YouTube頻道上發(fā)布了一個視頻,展示了汽車學(xué)習(xí)的實(shí)際情況,并指出這是“首個在自動駕駛汽車上進(jìn)行強(qiáng)化學(xué)習(xí)的例子。” 一開始,汽車像蹣跚學(xué)步的嬰兒一樣邁出第一步,但當(dāng)它轉(zhuǎn)向車道外時(shí),一名人類安全駕駛員將介入,將其轉(zhuǎn)回車道。車載算法學(xué)習(xí)到其每次修正路線都會犯錯,而且學(xué)習(xí)到其在沒有任何干預(yù)的情況下行駛了多遠(yuǎn)會獲得“獎勵”。
該視頻描述了用作“深度卷積神經(jīng)網(wǎng)絡(luò)”的車型只使用一個車載GPU處理接收到的單圖。與其他自動駕駛汽車不同,Wayve改裝后的雷諾汽車不需要“大型車型、花式傳感器以及無數(shù)的數(shù)據(jù)”,只利用公司的“快速有效學(xué)習(xí)的智能培訓(xùn)流程”就可學(xué)會自己在車道內(nèi)駕駛。
Wayve聯(lián)合創(chuàng)始人Amar Shah在今年5月曾發(fā)表講話說:“我們希望為車輛提供更好的大腦,而不是更多的硬件。” Wayve的下一個任務(wù)是擴(kuò)大其技術(shù)范圍,不只是讓自動駕駛汽車保持在原有車道內(nèi)行駛,而是完成更復(fù)雜的駕駛?cè)蝿?wù),Wayve希望該系統(tǒng)最終“能夠處理交通信號燈、環(huán)形交叉路口以及十字路口等情況” 。
工程師必備
- 項(xiàng)目客服
- 培訓(xùn)客服
- 平臺客服
TOP




















