自動駕駛主流芯片及平臺架構:低算力平臺

來源 |   阿寶1990
知圈  進“域控制器群”請加微13636581676,備注

自動駕駛主流芯片及平臺架構:低算力平臺的圖1
自動駕駛等級每增加一級,所需要的芯片算力就會呈現十數倍的上升,L2級自動駕駛的算力需求僅要求2-2.5TOPS,但是L3級自動駕駛算力需求就需要20-30TOPS,到L4級需要200TOPS以上,L5級別算力需求則超過2000TOPS。

之前介紹過特斯拉的算力是72TOPS,接下來介紹的幾款平臺都是在200TOPS以下的低算力平臺,主要是L2級別以上的自動駕駛平臺,比如Mobileye,其主要強項在于它基于視覺的ADAS應用,低算力平臺芯片有Mobileye、瑞薩、TI,地平線四家芯片平臺本期內容會一一介紹。

自動駕駛主流芯片及平臺架構:低算力平臺的圖2


Mobileye方案介紹

Mobileye成立于1999年,是以色列提供基于視覺系統分析和數據處理研發高級駕駛輔助系統和自動駕駛解決方案的全球先行者,為全球27家OEM廠和Tier1廠商提供“芯片+算法”軟硬一體化的ADAS視覺解決方案。
EyeQ系列芯片截至2019年底出貨5400萬,為全球超過5000萬輛汽車的行車安全保駕護航,目前全球ADAS市場占有率大約為70%。創辦之初公司致力于用單目視覺,提供包括行人檢測、車道保持和自適應巡航等輔助駕駛技術,1999年到2001年,Mobileye原型產品每年迭代一次,2001年Mobileye將自研的算法固化到芯片上并集成到汽車當中,從此開啟了EyeQ芯片的研發。
2004年4月,EyeQ1開始生產,隨后公司收獲多輪融資,將商業模式轉向汽車安全,陸續與大陸、意法半導體、麥格納、電裝、德爾福等全球頂級零部件供應商簽署合作協議。2007年,寶馬、通用和沃爾沃成為首批配裝Mobileye芯片的車企,Mobileye產品正式商用。2008年,Mobileye對外發布EyeQ 2,公司進入穩定發展期。2013年,Mobileye累計賣出產品突破100萬臺,隨后出貨量呈現爆發式增長。2017年3月,Mobileye被芯片巨頭英特爾以 153 億美元的價格收購。

2014年到2019年,公司營收復合增速達到44%,2019年收入8.79億美元,凈利潤27.9%,其中EyeQ系列芯片2019年出貨量達到1740萬顆。EyeQ1至EyeQ4等芯片型號已經量產,EyeQ5則預計于明年投放市場。EyeQ4多用于對半自動輔助駕駛技術的支持,最高支持到L3級別,而EyeQ5主要定位于Level 4/5無人駕駛階段的應用。

2019 年底,Mobileye EyeQ 芯片全球累計出貨超過 5400 萬片。
2020 年 9 月,Mobileye 透露,EyeQ 芯片全球出貨量超過 6000 萬片。
這 6000 萬片是 EyeQ2、EyeQ3 和 EyeQ4 之和,其中 2020 年新增的部分主要是 EyeQ4。

目前Mobileye一直采用傳感器+芯片+算法綁定的一體式解決方案,這種封閉模式也導致客戶開發靈活度下降,短期有利于提升市場占有率,受到轉型較晚或者AI投入少的OEM廠商歡迎,但長期將導致定制差異化產品的能力欠缺,因此需要快速迭代升級產品的造車新勢力或者對轉型速度要求較快的OEM廠商很難接受Mobileye的“黑盒”方式。

例如中國造車新勢力小鵬汽車曾短暫地用Mobileye的芯片做過測試后決定在P7上改用英偉達的Xavier,主要因為小鵬希望“把芯片和算法剝離開,采用可編程的芯片,在芯片上進行算法研發和定制化,跟場景結合”,因此選擇了更開放的英偉達。

自動駕駛主流芯片及平臺架構:低算力平臺的圖3

EyeQ4配置了4個CPU內核和6個矢量微碼處理器(VMP),每個CPU內核又擁有四個硬件線程。EyeQ4芯片引入了新穎的加速器類別:兩個多線程處理集群(MPC)內核,兩個可編程宏陣列(PMA)內核。結構上,EyeQ4使用 28nm的FD-SOI。功能上,相比EyeQ3,EyeQ4新增REM路網收集管理、駕駛決策、任意角度車輛識別、可行駛區域等功能。

自動駕駛主流芯片及平臺架構:低算力平臺的圖4

即將投放市場的EyeQ5將裝備8枚多線程CPU內核,同時還會搭載18枚Mobileye的下一代視覺處理器。

自動駕駛主流芯片及平臺架構:低算力平臺的圖5

EyeQ5具有更為復雜的功能,將采用7nm制程工藝。EyeQ5最多支持20個外部傳感器(攝像頭、雷達或激光雷達),“傳感器融合”是EyeQ5推出的主要目的。EyeQ5運算性能達到了12Tera/每秒,能耗不到5W,芯片節能效率是對標產品Drive Xavier的2.4倍。為了能夠運行L4/L5級別自動駕駛,英特爾自動駕駛系統將采用攝像頭為先的方法設計,搭載兩塊EyeQ5系統芯片、一個英特爾凌動芯片以及Mobileye軟件。EyeQ5有望實行“開放”戰略,Tier1和主機廠等合作伙伴都可以使用“開放式架構”來寫入自己的代碼,包括傳感器融合和駕駛決策等。

EyeQ5 Mobileye 的 SuperVision 即將量產
極氪 001 前面幾天的發布會,該車型的自動駕駛使用的就是 自動駕駛會采用 Mobileye 的 SuperVision 系統。
  
自動駕駛主流芯片及平臺架構:低算力平臺的圖6

SuperVision 是 Mobileye 打造的 360° 純視覺智能駕駛系統。所謂純視覺,簡單理解就是像特斯拉 FSD 一樣,用攝像頭來實現 L2 及以上級別輔助駕駛能力的智能駕駛系統。

自動駕駛主流芯片及平臺架構:低算力平臺的圖7
極氪 001 將搭載的自動駕駛輔助系統 Copilot,其集成了 2 顆 Mobileye EyeQ5 芯片和視覺感知算法 SuperVision,這是一套 L2+ 級自動駕駛系統。

2 顆 24 Tops/10 W 的 EyeQ5H 將為自動駕駛系統提供計算上的冗余,主系統芯片將包含完整的技術棧,另一顆芯片則提供冗余備份,在主系統失效時發揮作用。
 
極氪 001 的傳感器配置:  
  • 全車 15 個攝像頭;
  • 2 顆 EyeQ5H 高算力芯片,EyeQ5 芯片基于臺積電的 7nm FinFET 工藝打造,單芯片算力達到了 24 Tops,接近 EyeQ4 的十倍;
  • 1 個 250 m LRR 超長距毫米波雷達;
  • 12 個超聲波雷達。

可以實現的功能,包含:
  • 可解放雙手的高速自動駕駛:包括自動變道、不同高速公路之間的導航、自動上/下匝道以及城市道路輔助駕駛;
  • 自動泊車;
  • 標準 ADAS 功能:包括 AEB、ACC 以及 LKA 等;
  • DMS 駕駛員監控系統。

基于這個平臺打造的極氪 001 會在 2021 年實現 L2+ 級別的自動駕駛,類似于現在特斯拉的輔助駕駛能力,而到了2023 年基于此逐步實現高速 NoA 或者城市 NoA。

Mobileye 的后續產品路線

自動駕駛主流芯片及平臺架構:低算力平臺的圖8

EyeQ5 提供的算力水平是最高 24 TOPS,跟其他幾家相比,這個算力水平要遜色不少。
EyeQ6 才是 Mobileye 真正發力高性能的高端。
EyeQ6 預計于 2024/2025 年量產,分為高中低三個版本。
Mobileye 在 2016 年開始設計 EyeQ5,選定了 MIPS 的 I6500 做架構。
MIPS 在 I6500 架構之上,推出了特別針對車規的 I6500-F,而后續的 I7200 是針對無線市場的。
 
因此,Mobileye 在之后的一代芯片上,放棄了 MIPS 架構,而決定采用英特爾的 Atom 內核。

Atom 是英特爾處理器系列的常青樹,典型車載平臺是 Apollo Lake。
 
2016 年 6 月,英特爾從 Apolllo Lake 切換到 Goldmont 架構,并先后在特斯拉、寶馬、卡迪拉克、紅旗、現代、沃爾沃、奇瑞的車機上大量使用。
EyeQ6 要到 2024 年才量產,在各家的競爭中也顯得有些落后了。

自動駕駛主流芯片及平臺架構:低算力平臺的圖9


瑞薩自動駕駛平臺方案介紹

瑞薩是全球第二大汽車半導體廠家,全球第一大汽車 MCU 廠家,也是日本除索尼(索尼的主營業務主要是圖像傳感器)外最大的半導體廠家。
自動駕駛主流芯片及平臺架構:低算力平臺的圖10

瑞薩在整個座艙芯片(包括液晶儀表+中控導航)和自動駕駛全部都有布局,在不同系列的產品都有分入門級和高階版本。比如座艙的中間級別的芯片等級及時M級別,大眾邁騰與帕薩特用的M3系列芯片,定位為中檔座艙。
在高性能車載計算方面,瑞薩目前最頂級的產品是 R-CAR H3,主要用在座艙領域,目前最新款的長城H6的檸檬平臺就是使用的這個平臺。
自動駕駛主流芯片及平臺架構:低算力平臺的圖11

從上圖的roadmap 可以看到,在ADAS芯片這塊,瑞薩推出的芯片比較慢,在2018-2020年都是基于R-Car Gen3 架構推的ADAS芯片。R-Car Gen3基于Arm?Cortex?-A57 / A53內核,該內核使用Arm 64位CPU架構。它提供了處理來自車輛周圍多個傳感器的大量數據的能力。在開發入門級或高端系統時,在圖形和計算機視覺方面存在權衡。
在2018年推出的芯片是R-CAR V3M,這顆芯片是一款主要用于前置攝像頭應用的SoC,前置攝像頭面臨的挑戰是如何為計算機視覺提供高性能,同時支持低功耗和高水平的功能安全。由于前置攝像頭緊靠擋風玻璃安裝,因此必須考慮部件本身產生的熱量以及陽光直射造成的溫度升高。從而對低功耗的要求尤為嚴格。R-Car V3M 解決了這一難題,提高了攝像頭系統開發的功效。

2019年推出第二個視覺 SoC,即 R-CAR V3H,該產品具有高性能的視覺處理能力和AI處理能力,并具有業界領先的低功耗,該產品的目標應用是L3和L4級別的自動駕駛中的前置攝像頭的應用。新一代R-Car V3H產品針對立體前置環視應用做了優化,比R-Car V3M在視覺處理方面的性能提高了5倍。

?四個CPU核:ARM? Cortex?-A53 (1000MHz)
?支持雙Lockstep ARM Cortex-R7 (800MHz) CPU
?單通道32bit存儲器控制器LPDDR4-3200
?支持圖像識別引擎(IMP-X5-V3H)
?專門的CNN硬件加速器,密集的光流處理、密集的立體視覺差的處理和目標分類算法
?雙圖像信號處理(ISP)
?視頻輸出(4 lanes × 1 channel LVDS, 1 channel digital)
?視頻輸入(4 lanes × 2 channels MIPI-CSI2, 2 channels digital)
?支持兩路CAN-FD 接口
?一路FlexRay 接口
?支持一路千兆以太網和AVB以太網
?一路PCI Express 接口

這顆芯片的AI算力有4 TOPS,從芯片支持的算力和處理速度來看,非常適合處理一些圖像數據的處理,適合做傳感器的前融合的數據處理。

自動駕駛主流芯片及平臺架構:低算力平臺的圖12
前融合算法就是在原始層把數據融合在一起,融合好的數據就好比是一個超級傳感器,而且這個傳感器不僅有能力可以看到紅外線,還有能力看到攝像頭或者RGB,也有能力看到LiDAR的三維數據,就好比是一雙超級眼睛,在這雙超級眼睛上面,開發自己的感知算法,最后輸出一個結果層的物體。

瑞薩的V3H就想做這個前融合的超級傳感器,博世的下一代視覺系統內嵌V3H,當時由于天然缺陷,沒有辦法融合到雷達的數據,所以瑞薩需要開發加強版的V3U芯片。
自動駕駛主流芯片及平臺架構:低算力平臺的圖13

首先可以看到V3U 基于Renesas R-Car Gen 4架構,提供了從入門級應用到高度自動化駕駛系統的可擴展性。該部件可用于高級駕駛輔助系統(ADAS),允許使用風冷式電子控制單元(ECU),從而在重量和成本方面帶來優勢。
V3U 可以單芯片同時處理攝影機與雷達等傳感器資料,同時以AI進行自動駕駛控制與學習,同時達到汽車安全標準ISO 26262最高的ASIL D要求,確保系統簡單安全。
R-Car V3U SoC中的三大優勢:

1、高能效、高性能的卷積神經網絡(CNN)硬件加速器

隨著新一代ADAS和AD系統中使用的傳感器數量不斷增加,CNN處理性能也需要不斷加強。而通過減少由功率消耗產生的熱量,可以安裝空氣冷卻式電子控制單元(ECU),從而減少重量并降低成本。
自動駕駛主流芯片及平臺架構:低算力平臺的圖14

瑞薩電子目前已開發出具有出色深度學習性能的CNN硬件加速器內核,并為R-Car V3U以高密度配置了三個加速器內核,每個CNN加速器內核有2MB的專用存儲器,總共有6MB的存儲器。這樣一來,外部DRAM與CNN加速器之間的數據傳輸減少了90%以上。
R-Car V3U還提供多種可編程引擎,包括用于雷達處理的DSP,用于傳統計算機視覺算法的多線程計算機視覺引擎,用于提升圖像質量的圖像信號處理以及用于密集光流、立體差異和物體分類等關鍵算法等的其它硬件加速器。

瑞薩一直汽車電子領域,所以低功耗是它的拿手好戲,這里達到了驚人的 13.8 TOPS/W 的能效比,是頂配 EyeQ6 的 6 倍之多,這個非常恐怖。

R-Car V3U提供高度靈活的DNN深度神經網絡和AI機器學習功能。其靈活架構能夠運行所有用于汽車障礙物檢測與分類任務的最前沿神經網絡,提供60.4 TOPS高性能的同時,實現同類最佳的電源效率13.8 TOPS / W。

2、具有自我診斷能力的ASIL D系統安全機制

ISO 26262汽車功能安全標準是一項針對各種功能安全級別的數字目標(指標)。最高功能安全級別的ASIL D要求單點故障度量標準(SPFM)為99%以上,潛在故障度量標準(LFM)為90%以上,因此要求極高的隨機硬件故障檢測率。此外,由于先進車輛操作系統的不斷發展,如新一代ADAS和AD系統,汽車級SoC整體功能基本符合ASIL D標準。

自動駕駛主流芯片及平臺架構:低算力平臺的圖15

V3U 內部框架如上圖:采用 8 核 A76 設計。瑞薩沒有像特斯拉一樣,堆了 12 個 A72,而是使用了 ARM 的 Corelink CCI-500,即 Cache 一致性互聯,這些冗余的芯片架構設計,都是為了滿足ASIL D而設計。
瑞薩還開發出安全機制,用于快速檢測和響應SoC整體中發生的隨機硬件故障。通過組合適合特定目標功能的安全機制,既可以降低功耗,又可以提高故障檢測率。將上述機制整合到R-Car V3U中后,SoC的大多數信號處理都可達到ASIL D標準,且能夠具備自我診斷能力,降低AD系統中容錯設計的復雜性。

3、使軟件任務間免受干擾(FFI)的支持機制

軟件任務間免受干擾(FFI)是滿足功能安全標準的重要因素。當系統中存在具有不同安全級別的軟件組件時,防止較低級別任務影響較高級別任務而引發故障就顯得尤為重要。此外,當訪問硬件模塊和共享內存中的控制寄存器時,在SoC中確保FFI也非常重要。因此,瑞薩電子開發出一種FFI支持機制,可以監視通過SoC中互連流過的所有數據,并阻止任務之間的未授權訪問。這樣在SoC上執行的所有任務均可實現FFI,從而達到ASIL D標準應用,可實現管理對象識別、集成傳感器與雷達/LiDAR、規劃路線以及通過單個芯片發布控制指令。

自動駕駛主流芯片及平臺架構:低算力平臺的圖16

V3U 也是一個系列產品,針對不同層級自動駕駛的需求可以提供多個版本,這樣做是為了進一步提高出貨量,降低成本。
V3U 的產品系列采用的是模塊化設計,A76 可以是 2、4、8 核。
GPU 也可以不要,外設也可以輕松增減,靈活性很強。

算力不夠,安全來湊:

以技術而言,R-Car V3U并不算先進,至少NVIDIA在2020年5月公布的自動駕駛用次世代芯片Orin系列產品,CNN計算有10~2,000TOPS多種芯片;芯片是由臺積電制作,使用12納米(nm)制程,而臺積電已開始供應5~7納米制程芯片。
R-Car V3U樣品開始供貨的2020年12月17日,汽車芯片領域12納米制程算先進技術,但瑞薩預定的R-Car V3U量產時間是2023年4~6月,屆時是有點落后了。

在 Mobileye、瑞薩、英偉達、高通四大自動駕駛芯片廠家中,只有瑞薩的主業是汽車半導體,雖然算力稍微落后,但是它對汽車行業的理解最深,對車規重視程度最高,V3U是在幾家中唯一能過ASIL-D的廠家,同時有日本車廠加持,瑞薩希望非常之大。

自動駕駛主流芯片及平臺架構:低算力平臺的圖17


德州儀器TI自動駕駛平臺方案介紹

TI芯片是老牌的汽車芯片,同NXP、瑞薩是傳統座艙芯片的三大龍頭芯片廠家。
TI在處理器上實際上是走得兩條產品線,Jacinto和TDA系列。
自動駕駛主流芯片及平臺架構:低算力平臺的圖18

Jacinto系列將數字處理器的重點放在了汽車等應用上,主要是車載信息娛樂系統。
自動駕駛主流芯片及平臺架構:低算力平臺的圖19

但是從Jacinto6中,我們看到車載信息娛樂與ADAS功能的結合,這款芯片包括了雙ARMCortex-A15內核、兩個ARM M4內核、兩個C66x浮點DSP、多個3D/2D圖形處理器GPU(Imagination),并且還內置了兩個EVE加速器。無論是在處理娛樂影音方面,還是車載攝像頭的輔助駕駛,可利用汽車內部和外部的攝像頭來呈現如物體和行人檢測、增強的現實導航和駕駛員身份識別等多種功能。

TDA系列一直是側重于ADAS功能,可以看到TDA系列兼容性很強,硬件TDA2xV系列是可以做環視、后視等圖像處理。
自動駕駛主流芯片及平臺架構:低算力平臺的圖20

TDA3x系列可支持車道線輔助、自適應巡航控制、交通標志識別、行人與物體檢測、前方防碰撞預警和倒車防碰撞預警等多種ADAS算法。這些算法對于前置攝像頭、全車環視、融合、雷達與智能后置攝像頭等眾多ADAS應用的有效使用至關重要。
整體TDA系列的硬件和軟件都是可以向下兼容的,只是算力和應用方面的區別,這樣移植起來非常方便。
自動駕駛 Jacinto 7 系列架構芯片

自動駕駛主流芯片及平臺架構:低算力平臺的圖21

Jacinto 7系列架構芯片含兩款汽車級芯片:TDA4VM 處理器和 DRA829V 處理器,前者應用于 ADAS,后者應用于網關系統,以及加速數據密集型任務的專用加速器,如計算機視覺和深度學習。此外,這兩款處理器包含支持功能安全的微控制器(MCU),使得汽車廠商(OEM)和一級供應商能夠用單芯片同時支持 ASIL-D 高安全要求的任務和功能。

很多人在看到Jacinto 7 平臺發布的時候,基本上就宣布TI放棄了座艙域控制芯片的道路,往ADAS和網關方面轉型了,所以很多車廠基本上就放棄TI的Jacinto 6的選型,因為TI后續基本上不做座艙域控制芯片了。

DRA829V 處理器簡單介紹:

傳統汽車在網關部分采用的都是 CAN、LIN 等低速接口,對電控單元的升級不同,現在的汽車發展到了域的結構,包括動力域、ADAS 域等,都需要高速的總線接口。

隨著汽車實現聯網,需要多個計算資源管理更多的數據,需要 PCIe 和 ENET 滿足高帶寬 ECU 內和 ECU 間通信,而且在達到基本功能的同時要求高等級的功能安全,需要支持網絡安全 eHSM。
DRA829V 處理器是業界第一款集成了片上 PCIe 交換機的處理器,同時,它還集成了支持 8 端口千兆支持 TSN 的以太網交換機,進而能夠實現更快的高性能計算和整車通信。
自動駕駛主流芯片及平臺架構:低算力平臺的圖22

從上圖可以看出,在 DRA829V 進行了高度集成,將傳統的安全 MCU、eHSM、以太網交換機集成到一顆芯片中,降低了系統設計的復雜度。同時,注重了隔離性,功能等級從高到低混合起來性能依然穩定。
自動駕駛主流芯片及平臺架構:低算力平臺的圖23

DRA829V SoC 通過提供計算資源、在車輛計算平臺中高效移動數據以及在整個車輛網絡中進行通信,解決了新型車輛計算架構帶來的難題,可以看到DRA829V 主要是處理數據交互和安全的問題。
很多人都把這款芯片和 NXP發布的S32G混淆了,雖然兩個芯片都是用作網關,但是主要的出發點是不同的。
自動駕駛主流芯片及平臺架構:低算力平臺的圖24

NXP的S32G是作為一個成熟的網絡處理器設計的,處理各控制器的OTA升級、數據網關的交互,安全信息的傳輸等任務,其實沒有看到PCIE接口的速信號的轉發。

而DRA829V 更多是車內高速信號的集聯和轉發,同時也網關控制的功能,網關控制并不是主節點,僅僅是附屬功能。

TDA4VM自動駕駛芯片

由于使用該芯片的車型還沒有曝光,先來看看這顆芯片的規格參數。

自動駕駛主流芯片及平臺架構:低算力平臺的圖25

1Processor cores:
? C7x floating point, vector DSP, up to 1.0 GHz, 80 GFLOPS, 256 GOPS
? Deep-learning matrix multiply accelerator (MMA), up to 8 TOPS (8b) at 1.0 GHz
? Vision Processing Accelerators (VPAC) with Image Signal Processor (ISP) and multiple vision assist accelerators
? Depth and Motion Processing Accelerators (DMPAC)
? Dual 64-bit Arm? Cortex?-A72 microprocessor subsystem at up to 1.8 GHz, 22K DMIPS
– 1MB shared L2 cache per dual-core Cortex?-A72 cluster
– 32KB L1 DCache and 48KB L1 ICache per Cortex?-A72 core
? Six Arm? Cortex?-R5F MCUs at up to 1.0 GHz, 12K DMIPS
– 64K L2 RAM per core memory
– Two Arm? Cortex?-R5F MCUs in isolated MCU subsystem
– Four Arm? Cortex?-R5F MCUs in general compute partition
? Two C66x floating point DSP, up to 1.35 GHz, 40 GFLOPS, 160 GOPS
? 3D GPU PowerVR? Rogue 8XE GE8430, up to 750 MHz, 96 GFLOPS, 6 Gpix/sec
?Custom-designed interconnect fabric supporting near max processing entitlement
Memory subsystem:
? Up to 8MB of on-chip L3 RAM with ECC and coherency
– ECC error protection
– Shared coherent cache
– Supports internal DMA engine
? External Memory Interface (EMIF) module with ECC
– Supports LPDDR4 memory types
– Supports speeds up to 3733 MT/s
– 32-bit data bus with inline ECC up to 14.9GB/s
? General-Purpose Memory Controller (GPMC)
? 512KB on-chip SRAM in MAIN domain, protected by ECC
Safety: targeted to meet ASIL-D for MCU island and ASIL-B for main processor
? Integrated MCU island subsystem of Dual Arm? Cortex?-R5F cores with floating point coprocessor and optional lockstep operation, targeted to meet ASIL-D safety requirements/certification
– 512B Scratchpad RAM memory
– Up to 1MB on-chip RAM with ECC dedicated for R5F
– Integrated Cortex?-R5F MCU island isolated on separate voltage and clock domains
– Dedicated memory and interfaces capable of being isolated from the larger SoC
?The TDA4VM main processor is targeted to meet ASIL-B safety requirements/certification
– Widespread ECC protection of on-chip memory and interconnect
– Built-in self-test (BIST) an

正常情況下看規格書都是英文,這里簡單對于高性能參數方面再闡述一下。

TDA4VM處理器核采用C7x浮點,矢量DSP,高達1.0 GHz, 80 GFLOPS, 256 GOPS;
深度學習矩陣乘法加速器(MMA),1.0GHz高達8 TOPS (8b);
視覺處理加速器(VPAC)和圖像信號處理器(ISP)和多個視角輔助加速器;
深度和運動處理加速器(DMPAC);
具有兩個64位 Arm? Cortex?-A72微處理器子系統,工作頻率高達1.8GHz,22K DMIPS;
每個Cortex?-A72核集成了32KB L1 DCache和48KB L1 ICache,有六個Arm? Cortex?-R5F MCU,工作頻率高達1.0GHz,12 K DMIPS;
每個核存儲器為64K L2 RAM,隔離MCU子系統有兩個Arm? Cortex?-R5F MCU,通用計算部分有四個Arm? Cortex?-R5F MCU,兩個C66x浮點DSP,工作頻率高達1.35 GHz, 40 GFLOPS, 160 GOPS;

TDA4VM處理器僅使用5到20W的功率執行高性能ADAS運算,無需主動冷卻。

高性能內核概述:

“C7x”下一代DSP 將TI 行業領先的DSP 和EVE 內核整合到單個性能更高的內核中并增加了浮點矢量計算功能,從而實現了對舊代碼的向后兼容性,同時簡化了軟件編程。在典型汽車最壞情況結溫125°C 下運行時,新型“MMA”深度學習加速器可在業界最低功率包絡內實現高達8TOPS 的性能。專用的ADAS/AV 硬件加速器可提供視覺預處理以及距離和運動處理,而不會影響系統性能。

自動駕駛主流芯片及平臺架構:低算力平臺的圖26

TI公司的TDA4VM處理器系列是基于Jacinto? 7架構,目標用在駕駛輔助系統(ADAS)和無人駕駛汽車(AV).TDA4VM處理器具有強大的片上數據分析的能力,并與視覺預處理加速器相結合,從而使得系統性能更高效。汽車廠商和一級供應商可用來開發前置攝像頭應用,使用高分辨率的800萬像素攝像頭,幫助車輛看得更遠并且可以加入更多駕駛輔助增強功能。
此外,TDA4VM處理器能夠同時操作4到6個300萬像素的攝像頭,同時還可以將雷達、激光雷達和超聲波等其他多種感知處理融合在一個芯片上。這種多級處理能力使得TDA4VM能夠勝任ADAS的中心化處理單元,進而實現自動泊車應用中的關鍵功能(如環繞視圖和圖像渲染顯示),同時增強車輛感知能力,實現360度的識別感知。

自動駕駛主流芯片及平臺架構:低算力平臺的圖27

從整個芯片性能和功能來看,結合無人駕駛系統架構,其實TI的ADAS芯片和瑞聲的V3H基本上十分類似,都是做圖像或者雷達的數據融合處理,而且都是以低功耗為主,算法需要十分強大,這樣提高芯片的處理能力,把處理完的信號再給到控制芯片。

TDA4M 優勢:

以更低的功耗提高車輛感知能力
通過接入攝像頭、雷達和激光雷達數據,ADAS技術幫助汽車看到并適應周圍的世界。大量信息涌入汽車意味著處理器或片上系統需要快速有效地實時管理多級數據處理,并且需要滿足系統的功耗要求。TI的新處理器僅使用5到20W的功率執行高性能ADAS運算,無需主動冷卻。

TDA4VM 以業界領先的功耗/性能比為傳統和深度學習算法提供高性能計算,并具有很高的系統集成度,從而使支持集中式ECU 或獨立傳感器中多種傳感器模式的高級汽車平臺實現可擴展性和更低的成本。
關鍵內核包括具有標量和矢量內核的下一代DSP、專用深度學習和傳統算法加速器、用于通用計算的最新Arm 和GPU 處理器、集成式下一代成像子系統(ISP)、視頻編解碼器、以太網集線器以及隔離式MCU 島。所有這些都由汽車級安全硬件加速器提供保護。

自動駕駛主流芯片及平臺架構:低算力平臺的圖28


地平線自動駕駛平臺方案介紹

地平線具有領先的人工智能算法和芯片設計能力,通過軟硬結合,設計開發高性能、低成本、低功耗的邊緣人工智能芯片及解決方案,面向智能駕駛和 AIoT ,地平線可提供超高性價比的邊緣 AI 芯片、極致的功耗效率、開放的工具鏈、豐富的算法模型樣例和全面的賦能服務。

依托行業領先的軟硬結合產品,地平線向行業客戶提供“芯片 + 算法 + 工具鏈”的完整解決方案。在智能駕駛領域,地平線同全球四大汽車市場(美國、德國、日本和中國)的業務聯系不斷加深,目前已賦能合作伙伴包括奧迪、博世、長安、比亞迪、上汽 、廣汽等國內外的頂級 Tier1s ,OEMs 廠商;

而在 AIoT 領域,地平線攜手合作伙伴已賦能多個國家級開發區、國內一線制造企業、現代購物中心及知名品牌店。目前基于創新的人工智能專用計算架構 BPU(Brain Processing Unit),地平線已成功流片量產了中國首款邊緣人工智能處理器--專注于智能駕駛的 “征程(Journey)”系列處理器和專注于 AIoT 的 “旭日(Sunrise)” 系列處理器,并已大規模商用。

自動駕駛主流芯片及平臺架構:低算力平臺的圖29

車規級芯片道路上,公司有超強的耐心和長遠規劃的戰略能力,2020年6月長安UNI-T上市標志著公司的征程二代成為中國首個車載商用量產的AI芯片,萬里長征路已經取得領先。相比其他AI芯片新秀一開始就進入手機、攝像頭等消費級場景希望快速實現收入增長,地平線選擇了一條最困難的道路,挑戰AI行業的珠穆朗瑪峰——車規級AI芯片,并進入與傳統芯片巨頭搏殺的賽道。

自2015年創立以來,地平線僅用了5年的時間即實現了車規AI芯片的量產落地,開啟國產車規級AI芯片的前裝量產元年。公司目前擁有多個主機廠定點項目訂單,2020~2023年預計將迎來全面的收入和業績爆發式增長。考慮到樣片流片、車規級認證和車型導入的時間,地平線成立5年即實現車規AI芯片量產在整個汽車電子行業都處于領先位置。與此相比,Mobileye的車規芯片從研發到正式商用歷時8年;作為全球通用AI芯片龍頭的英偉達,在CUDA發布后9年才將K1芯片應用于奧迪A8的車用系統。

征程系列芯片可以同時支撐智能汽車智能座艙AI應用和自動駕駛應用,應用于智能座艙域和自動駕駛域,最終成為中央計算平臺主控芯片。目前征程二代可支撐L2自動駕駛應用,下一代芯片將支持L3/L4自動駕駛應用。

自動駕駛主流芯片及平臺架構:低算力平臺的圖30

未來智能座艙走向交互方式升級,例如車內視覺(光學)、語音(聲學)以及方向盤、剎車踏板、油門踏板、檔位、安全帶等底盤和車身數據,利用生物識別技術(車艙內主要是人臉識別、聲音識別),來綜合判斷駕駛員(或其他乘員)的生理狀態(人像、臉部特征等)和行為狀態(駕駛行為、聲音、肢體行為),做到讓車真正“理解”人,座艙演變成全面“個人助理”。

自動駕駛主流芯片及平臺架構:低算力平臺的圖31

因此地平線去年發布的征程二代芯片擁有強大的智能座艙多模感知算法支撐能力,并在2020年4月上市的長安SUV車型UNI-T上正式商用,目前UNI-T智能座艙功能如視線亮屏、分心提醒、疲勞監測、智能語音拍照等均已達到成熟穩定的高標準用戶體驗。

目前征程二代能夠對多類目標進行實時檢測和精準識別,并提供高精度且低延遲的感知輸出,可滿足自動駕駛視覺感知、視覺建圖定位、視覺 ADAS 等智能駕駛場景的需求,以及語音識別,眼球跟蹤,手勢識別等智能人機交互的功能需求。

可以同時跑超過 60 個分類任務,每秒鐘識別目標數可以超過 2000 個,因此完全可以滿足L2級別智能駕駛的各類視覺應用需求,預計2020年~2021年將會看到正式搭載征程系列芯片實現ADAS功能的量產汽車。

地平線2020年1月份宣布推出新一代自動駕駛計算平臺——Matrix 2.0,搭載地平線征程二代車規級芯片,可滿足L2~L4級別自動駕駛需求。感知層面, Matrix 2.0可支持包括攝像頭、激光雷達在內的多傳感器感知和融合,實現高達23類語義分割以及六大類目標檢測,感知算法還能夠應對復雜環境,支持在特殊場景或極端天氣的情況下輸出穩定的感知結果。
自動駕駛主流芯片及平臺架構:低算力平臺的圖32

在Robotaxi 領域,地平線與多家頂級自動駕駛運營公司達成合作,目前Matrix 被應用于近千輛的測試車隊并開已開展商業運營服務;在整車廠領域,地平線與奧迪長期在高級別自動駕駛技術研發及產品化等方面展開合作,助力奧迪在無錫獲得了 L4 路測牌照,奧迪中國首次在國內實際高速公路場景進行乘用車編隊 L4 自動駕駛及車路協同演示也是采用Matrix計算平臺。

新產品路徑規劃清晰,下一代芯片均在研發和實流片途中,預期單芯片算力未來將接近100TOPS,處理多達16路視頻信號。地平線征程二代芯片成功商用是公司新的里程碑,目前征程二代已經拿到多個國家的市場客戶的前裝的定點。公司后續新產品升級和規劃也在快速推進和落地,優秀的商業落地成績源于持續不斷的前瞻性技術探索和 AI 芯片產品的快速迭代。
自動駕駛主流芯片及平臺架構:低算力平臺的圖33

作為全球邊緣 AI 芯片領導者,地平線繼 2019 年成功推出車規級 AI 芯片征程 2 之后,將于今年推出面向高等級自動駕駛的旗艦級芯片征程 5,具備 96TOPS 的 AI 算力,實際性能領先國際,并將以邊緣人工智能芯片為核心,面向自動駕駛落地應用的實際需求,為產業提供具備極致效能、全面靈活的賦能服務。
自動駕駛主流芯片及平臺架構:低算力平臺的圖34

5月9日消息,國產車載AI芯片廠商地平線官方宣布,其第三代車規級產品,面向L4高等級自動駕駛的大算力征程5系列芯片,比預定日程提前一次性流片成功并且順利點亮!

作為業界第一款集成自動駕駛和智能交互于一體的全場景整車智能中央計算芯片,征程 5 系列芯片基于 SGS TV Saar認證的汽車功能安全(ISO 26262)產品開發流程體系打造,單顆芯片 AI 算力最高可達 128 TOPS,同時支持 16 路攝像頭感知計算。此外,基于征程 5 系列芯片,地平線將推出 AI 算力高達 200~1000TOPS 的系列智能駕駛中央計算機,兼備業界最高 FPS(frame per second) 性能與最低功耗。

在J5之前,地平線已先后推出車規級芯片J2以及J3。目前J2、J3已在長安、奇瑞等多家車企的車型上實現量產,后續拿下長城、東風嵐圖、廣汽、江淮、理想、上汽(按照首字母排序)等多家自主品牌車企的多款主力爆款車型上實現定點開發,預計這1-2年會陸續出貨。

J5將是地平線第一款面向高等級自動駕駛的大算力芯片,J5將在今年內正式發布。據此前官方披露的消息,基于J5的合作車型量產預計在2022年。

自動駕駛主流芯片及平臺架構:低算力平臺的圖35

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP