地平線陳黎明:汽車AI的發展需要由中央計算平臺來支持

2022年3月25-27日,中國電動汽車百人會論壇(2022)正式召開。地平線總裁陳黎明發表演講。


地平線陳黎明:汽車AI的發展需要由中央計算平臺來支持的圖1

各位嘉賓、業界各位同仁,女士們、先生們:

大家上午好。我是地平線陳黎明。首先非常感謝百人會的邀請,參加今天的全球智能汽車前沿峰會,同時也非常抱歉,由于疫情原因不能前往北京參加這次盛會。

今天我要給大家分享的題目是“擁抱高性能中央計算時代,助力智能汽車技術的躍遷”。

首先讓我們一起來看一下汽車電子電氣架構的演進。目前大部分汽車用的還是傳統的分布式電子電氣架構,面對智能汽車的發展,這個架構遇到的最大挑戰就是可擴展性不好,軟件的開發環境不一致,那么硬件資源協調也非常的困難,在數據傳輸的帶寬上遇到了很大的瓶頸。

這些年我們看到,一個新的控制架構叫做域架構,也開始在汽車中得到應用。它的特點是按照功能進行劃分,設計域控制器,它是一個更支持面向服務的架構,整個資源可以更好地集中使用,可以根據不同的域來劃分它的安全和可靠性等級,使得整個硬件達到比較優的架構,千兆以太網的引入也加速了數據的傳輸。

但是隨著智能汽車的發展,特別是高階自動駕駛技術的需求,對整個軟件算力和數據傳輸提出了更高的要求,域控制器和域架構已不能滿足高階自動駕駛的發展需求,中央計算架構由此孕育而生。這個架構的特點是中央控制器加上區控制器的架構,它把計算與執行進行分離,同時也是一個更加開放的軟件開發平臺。通過硬件資源的虛擬化和容器化,使得開發者能夠更加便捷地在這個架構上開發軟件,也更好地支持了10G以太網以及高速接口的應用,大大提升了整個算法的計算效率以及數據傳輸能力,來更好地支持整個高階自動駕駛的發展。

接下來,我們一起來看下智能汽車AI計算架構的演進。在目前的傳統架構中,AI的計算基本上分割成兩個部分,主要是在自動駕駛和智能座艙方面,它應用的還是傳統計算芯片,AI的算力非常有限,所以很多功能得不到實現,也就造成了一些體驗不夠順暢。這個問題在域架構中得到了比較好的解決。智能汽車在域架構狀態下分成了駕駛域和座艙域,同時引用了算力較大的AI芯片。這樣的話,性能得到了進一步提升,使得整個自動駕駛的安全性還有體驗得到更好地保障。

我們知道,隨著智能汽車,特別是高階自動駕駛的發展,對AI算法提出了更高的要求,在復雜性和算力方面也提出了更高的要求,域控制器遠遠不能滿足這方面的需求,孕育而生的是中央計算平臺。所以我們非常相信整個AI的發展需要由中央計算平臺來進行支持。在這個中央平臺架構下,整個AI的計算融成為一體:人、路、車的數據統一都接入AI計算平臺,進行一體化的感知,使這個感知更加精確和及時,在自動駕駛和人機交互方面也更加地順暢,性能更加提升。同時,它的硬件可以插拔,也就是它的算力可以進一步擴張。

接下來我再給大家介紹一下地平線去年發布的征程5芯片。它是一款面向全場景整車智能的中央計算平臺芯片,可以說是一個強算力、高性能、低延遲和低功耗的芯片,具有128 TOPS的AI算力,在Microsoft CoCo(數據)集上,能夠處理1283幀/每秒的計算,目前在業界屬于最強性能的計算芯片,同時它在處理延遲方面只有60毫秒,也是業界最低。在125度的環境下,它的功耗只有30瓦。

我想再給大家介紹一下AI芯片的算力以及真實AI效能之間的區別。我們平時所說的AI算力是指TOPS/Watt(每瓦多少TOPS)或者TOPS/Dollar(每一美金多少TOPS),這個是由整個硬件設計來決定的,它代表了AI芯片的理論峰值,但并不代表在實際使用中,我們能夠用到所有的計算能力。這里有一個有效利用率的問題,它取決于整個芯片的硬件架構設計以及編譯器的編譯能力。編譯器是否能夠把AI算法編譯成最適配硬件架構和硬件的能力。除了這兩個因素之外,我們還要考慮第三個因素,就是AI算法本身的效能。它以FPS/TOPS(每TOPS能夠處理多少幀頻)來代表,這個代表了算法本身的先進性和復雜性,同時也體現在AI算法工程化的過程中,也就是說編譯器是否能夠把很好的AI算法轉換成非常適合硬件架構以及硬件能夠最適配的計算方法和計算能力,最終把整個AI芯片最高地利用計算效能。綜合三個因素,最后才能得出真實的AI效能,也就是說我們表達的FPS/Watt(每瓦能夠處理多少幀頻),或者FPS/Dollar(每一美金能夠處理多少幀頻)。

接下來我想給大家再分享一下地平線最新的貝葉斯BPU處理器。這是地平線具有自主知識產權的處理器,它是通過幾個方面的突破來達到高性能和低延遲。首先,它是通過一個本地的數據計算,也就是利用高帶寬、靈活互聯的近存計算方式,就是片內的存、算在一起,來減少對外界存儲器的數據傳輸和讀寫,大大提升運算效率。第二,是通過對一些常用的算子算法,包括脈動卷積、向量處理、數據重塑、深度學習、內存讀寫等等,通過硬件來加速這些運算的進行,實現一個高度可并行的計算的硬件架構。同時,在軟件方面,也對指令進行并行化,對AI模型進行分層融合,使得模型能夠并行運轉,最高效率地利用整個計算單元的每一個時段來進行軟件的計算高度并行化。通過三個措施,我們就實現了高性能和低延遲,也就是達到了128 TOPS的算力和在Microsoft CoCo(數據)集上1283幀/每秒的效能,同時延遲只有60毫秒。

接下來再給大家介紹一下地平線的整體技術和解決方案。底層是地平線的征程系列芯片J2(征程2)、J3(征程3)和J5(征程5),在這之上是高效能的TogetherOS操作系統。同時它也可以兼容其他的常用操作系統,包括Linux、QNX、安卓等操作系統。在操作系統之上是一個AI算法集,相當于一個算法庫,這里集中了目前通用的和最先進的算法。有了好的芯片、操作系統和算法還不夠,還需要有非常好的開發工具鏈,來幫助開發者更快、更好地使用芯片。天工開物就是一個非常強大的開發工具鏈,大家可以看到我們開發工具鏈已經有100多個客戶在使用,使用效果也是非常得好,它的精度損失率小于1%,同時在首次使用時成功率超過了80%。另外,我們還有一個艾迪云平臺,這也是一個完整的開發工具鏈和 AI模型云訓練平臺,利用這個平臺可以完整地使用我們的芯片,包括工具鏈以及 AI模型的訓練,形成一個數據閉環,使得開發者能夠更好、更快速地應用我們的芯片,并且同時開發他們的應用。

在這些基礎之上是我們的解決方案,它包括智能駕駛,還有智能座艙、人機交互,這只是一個可選的,同時支持在我們的芯片、操作系統、算法開發工具上來支持客戶的應用,所以我們可以更多地去兼容所有客戶的一個應用場景。

接下來我想給大家介紹一下地平線的芯片是如何助力智能汽車快速落地的。在最下面一層是征程2、征程3還有征程5芯片,最左邊是征程2和征程3,在自動駕駛輔助方面的應用。目前,我們在很多ADAS項目上已經進行了量產,它主要能夠支持2兆(百萬像素)和8兆(百萬像素)的攝像頭,主要是前視輔助駕駛。在智能座艙方面,它能夠支持30多個模型來實現多模的交互,增加感知體驗。

在中間這部分是我們基于3J3(3顆征程3芯片)的一個域控解決方案。目前我們已經拿到了客戶的定點,在自動駕駛方面它能夠支持8兆(百萬像素)和2兆(百萬像素),6到11個攝像頭,算力能夠達到15 TOPS,最主要是應用在高速領航輔助駕駛這個方面。在智能座艙方面,它能夠支持50多個模型,它能夠使得多模交互更加流暢、更加平順。

右邊部分是我們最新的征程5芯片,它可以有雙J5(2顆征程5芯片)和4J5(4顆征程5芯片)的組合。根據客戶自動駕駛的需求,它在自動駕駛方面能夠支持8兆(百萬像素)和2兆(百萬像素),12到19個攝像頭,它的算力能夠從256(TOPS)到512(TOPS),根據客戶需求進行選擇,最主要是它能夠支持高速和城區的高度自動駕駛。在智能座艙方面,它能夠支持100多個模型和功能安全,以及艙內的360°感知,使得人機共駕進行更流暢的人機共駕和實現一個真正的第三空間。

上面介紹了我們的芯片技術和一些解決方案,來如何支持我們的客戶和主機廠實現智能汽車的快速落地。這里我想再把我們的商業模式做個簡單介紹。我們整體的商業模式是一個豐儉由人的開放共贏商業模式,我們定位是Tier-2,根據主機廠和Tier-1的需求,我們提供芯片、開發工具鏈和AI訓練平臺,也可以提供量產級的算法,當然這個是完全根據主機廠的需求來提供。對于硬件客戶來講,我們來提供芯片和硬件參考設計方案,幫助硬件客戶快速地開發量產級的硬件,來支持主機廠的需求。對于軟件客戶來講,我們提供參考算法、開發板,還有開發工具鏈,使他們能夠在我們的芯片基礎上很快地開發出量產級的算法和系統軟件算法,來支持主機廠的項目。

我們開放共贏的商業合作模式,得到了業界廣泛的認可,目前我們與超過17家主機廠在進行深度合作,前裝項目超過了45個,正在開發當中。去年我們的征程芯片出貨超過了100萬,也是在中國唯一一家實現了車規級芯片量產的企業。我們定位Tier-2,是作為行業的一個賦能者,我們希望以征程芯片作為基石,打造智能汽車產業界的一個全局生態。目前我們與很多主流的主機廠還有新勢力都有深度合作,同時跟Tier-1還有硬件、傳感器以及軟件合作伙伴進行廣泛深入的合作,來共同打造智能汽車的發展。

我們堅定地相信,只有共創共贏,我們一起才能走得更遠。只有開放才能夠共贏。我們愿意與所有的合作伙伴一起,為中國智能汽車的發展和快速落地共同努力。我的分享到這里結束,謝謝大家。


汽車全產業鏈報道歡迎聯系汽車俱樂部Plus,主編微信:18701404010

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP