
發(fā)布
注冊(cè)
/
登錄AI處理器的案例
站在巨人肩上,Arm第一代AI處理器究竟如何?
在本周舉行的、一年一度的Hot Chips會(huì)議上,移動(dòng)芯片IP供應(yīng)商Arm也展示了他們的第一代機(jī)器學(xué)習(xí)處理器,在今年晚些時(shí)候,合作伙伴也則可以用上這些IP。
這個(gè)最先被名為“Trillium”的架構(gòu)由一些熟悉的元素與Arm邏輯核心捆綁在一起,對(duì)于那些對(duì)Nvidia Volta GPU提供的TensorCore、深鑒提供的壓縮技術(shù)、擁有可編程特性的FPGA和低功耗的DSP感興趣的人來說,這可能意味著很多。換句話說,Arm可能剛剛“拼湊”出了世界上最好的AI處理器,對(duì)于那些芯片制造商來說,這可能會(huì)是很大的麻煩。
正如Arm的技術(shù)總監(jiān)兼杰出工程師Ian Bratt本周在Hot Chips上告訴我們的那樣,作為首次涉足AI處理器初哥,Arm的設(shè)計(jì)目的是盡可能拓寬產(chǎn)品的應(yīng)用范圍,以便能夠滿足服務(wù)器端AI的市場(chǎng)需求,同時(shí)也可以為汽車和物聯(lián)網(wǎng)這些小型設(shè)備提供服務(wù)。
“在第一代機(jī)器學(xué)習(xí)處理器的開發(fā)過程中,我們走了一些彎路,那就是我們將舊框架帶入了一個(gè)新問題。我們可以看到GPU,CPU和DSP如何被用于機(jī)器學(xué)習(xí),但我們開始看到我們?nèi)绾文軌蚋黠@地利用每一項(xiàng)技術(shù)?!?如下所示,Arm的機(jī)器學(xué)習(xí)架構(gòu)并沒有什么特別之處,但值得注意的是他們從硬件,壓縮和編譯器中最成功的創(chuàng)新中汲取的東西。
構(gòu)建塊是計(jì)算引擎,每個(gè)(總共16個(gè))是64 KB的SRAM片。MAC引擎(與Nvidia的TensorCore不同)是執(zhí)行卷積的地方,可編程層引擎處理層之間的大部分必要的混排(shuffling)。該架構(gòu)具有DMA引擎,用于與外部存儲(chǔ)器接口通信。Arm自己的Cortex技術(shù)則充當(dāng)控制引擎。
Bratt通過對(duì)神經(jīng)網(wǎng)絡(luò)處理器芯片中最重要的內(nèi)容的理解來打破各種架構(gòu)特征。
展開 人工智能+語音引爆CES
Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發(fā)的第一款“非DSP”技術(shù)。他在發(fā)布Neupro時(shí)說:“我有點(diǎn)緊張。但是你必須知道AI并不是訊號(hào)處理方面的問題?!?NeuPro處理器搭載兩個(gè)硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動(dòng)和規(guī)范層,但是,可程序設(shè)計(jì)的向量引擎NeuPro VPU是執(zhí)行專有AI算法的一種延伸。“我們選擇了這種硬聯(lián)機(jī)的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率?!?Ceva聲稱,這款新的專用AI處理器系列帶來了“相當(dāng)高的性能提升,從入門級(jí)處理器的2TOPS到為最高階配置的12.5TOPS”。
NeuPro硬件模塊;Ceva首席執(zhí)行官Gideon Wertheizer強(qiáng)調(diào),“NeuPro VPU和NeuPro引擎之間的無縫切換至關(guān)重要”。
Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權(quán),并計(jì)劃在第三季全面發(fā)布。
同樣地,聯(lián)發(fā)科準(zhǔn)備推出一款由意騰科技(Intelligo Technology)設(shè)計(jì)的AI處理器和算法。Intelligo是2016年時(shí)從聯(lián)發(fā)科獨(dú)立而出的新創(chuàng)公司。
Intelligo設(shè)計(jì)的這款AI SoC被稱為“智能DNN語音處理器”應(yīng)用范圍較有限。聯(lián)發(fā)科表示,該處理器提供“可配置的深度神經(jīng)網(wǎng)絡(luò)和高效率推論引擎(每秒每瓦特1 TOPS運(yùn)算性能)”。
顧大為表示,聯(lián)發(fā)科正在尋找一種小型的AI加速器,為辨識(shí)20到30個(gè)關(guān)鍵詞而設(shè)計(jì)。另一方面,聯(lián)發(fā)科也正推廣其“分布式處理”的觀念,期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實(shí)于廣泛的小型設(shè)備——如電燈開關(guān)。
來源:環(huán)球自動(dòng)化網(wǎng)
展開 全球首顆模擬AI芯片,集成了RISC-V處理器
每個(gè) Mythic ACE 都配有一個(gè)數(shù)字子系統(tǒng),包括 32 位 RISC-V 納米處理器、64KB SRAM、SIMD 矢量引擎和高吞吐量片上網(wǎng)絡(luò) (NoC) 路由器。模擬矩陣處理器能夠以高達(dá) 25 TOPS 的速度提供高能效的 AI 推理。
“邊緣設(shè)備現(xiàn)在可以部署強(qiáng)大的 AI 模型,而不會(huì)面臨高功耗、熱管理和外形尺寸限制的挑戰(zhàn),”該公司表示。
邊緣人工智能
Mythic 的主要重點(diǎn)是邊緣 AI 部署。該公司還在數(shù)據(jù)中心提供服務(wù)器級(jí)計(jì)算。企業(yè)可以使用邊緣 AI 來部署在邊緣設(shè)備上本地運(yùn)行的ML 模型。然而,邊緣人工智能面臨一些挑戰(zhàn):
低功耗:設(shè)備的功耗和相關(guān)熱量隨著更多功能和功能的添加而增加。有時(shí),它們由功率預(yù)算有限的以太網(wǎng)供電 (PoE) 供電。即使在 0.5 或 2W 時(shí),設(shè)備也需要表現(xiàn)出強(qiáng)大的性能。
不使用時(shí)功率應(yīng)該接近于零,并且這些不同模式之間的切換應(yīng)該快速而簡(jiǎn)單。
小尺寸:在數(shù)據(jù)源運(yùn)行的AI算法具有最小的延遲問題,并且不會(huì)因視頻壓縮而損失準(zhǔn)確性;因此,不需要大型 PCIe 卡、大型散熱器或風(fēng)扇。整個(gè)系統(tǒng)需要適合其他人使用的 22mm x 30mm M.2 A+E 卡。
即使使用更大的 PCIe 卡,加速器和冷卻解決方案的大小也決定了可以塞入多少 AI。
成本效益:以可承受且有效的價(jià)格提供高功率計(jì)算的能力為客戶提供了根據(jù)客戶需求進(jìn)行擴(kuò)展的自由度。
展開 馬斯克發(fā)大招,自動(dòng)駕駛AI專用芯片近了?
據(jù)外媒報(bào)道,美國著名電動(dòng)汽車品牌特斯拉CEO伊隆?馬斯克(Elon Musk)日前在推特上表示,公司下一代Autopilot自動(dòng)駕駛系統(tǒng)有望于明年年初正式亮相,系統(tǒng)將采用獨(dú)立研發(fā)的人工智能處理器。特斯拉三年前便開始研發(fā)用于自動(dòng)駕駛的人工智能處理器,馬斯克這一表態(tài),意味著該款處理器已經(jīng)取得了重大進(jìn)展。自動(dòng)駕駛被認(rèn)為是除數(shù)據(jù)中心之外,人工智能最具期待的應(yīng)用市場(chǎng)之一,目前業(yè)界基本采用英偉達(dá)的GPU等通用處理器作為解決方案,特斯拉自研專用芯片的開發(fā)進(jìn)程受到業(yè)界普遍關(guān)注。
特斯拉自研AI 處理器取得重大進(jìn)展
特斯拉一直在自主研發(fā)用于自動(dòng)駕駛汽車的人工智能處理器,而不是依賴于英偉達(dá)等廠商。在日前的財(cái)報(bào)會(huì)議中,馬斯克表示特斯拉為自動(dòng)駕駛汽車而打造的人工智能 AI 處理器已基本準(zhǔn)備就緒。按照馬斯克的說法,基于該芯片未來將會(huì)被運(yùn)用到 Model3、Model X 和 Model S 的 Autopilot 自動(dòng)駕駛系統(tǒng)之中。這也是特斯拉自主研發(fā)的首款人工智能處理器。
根據(jù)Gartner研究總監(jiān)盛陵海的介紹,自動(dòng)駕駛系統(tǒng)主要包括前端與后端兩個(gè)部分,前端為感知端,包括攝像頭、毫米波雷達(dá)等,主要進(jìn)行數(shù)據(jù)采集,市場(chǎng)上以日前被英特爾并購的Mobileye公司提供的解決方案為主。后端為主控平臺(tái),主要執(zhí)行數(shù)據(jù)處理、深度學(xué)習(xí)等功能,主要采用英偉達(dá)基于GPU開發(fā)的Drive PX 2等處理平臺(tái)。特斯拉的Autopilot 2.0硬件套件即由英偉達(dá)GPU支持。
然而,有消息稱,特斯拉早在三年前就已開始進(jìn)行自動(dòng)駕駛定制人工智能處理器的開發(fā)。公開資料上,馬斯克首次提到這款自動(dòng)駕駛AI處理器則是在去年12月。
展開 
AI Environment是一款世界頂級(jí)的CAE分析前后處理器
AI Environment是一款世界頂級(jí)的CAE分析前后處理器,為所有世界流行的CAE軟件提供高效可靠的分析模型。她除了提供其它軟件具有的普通前后處理功能外,強(qiáng)大的CAD模型修復(fù)能力、自動(dòng)中面抽取、獨(dú)特的網(wǎng)格“雕塑”技術(shù)、網(wǎng)格編輯技術(shù)以及廣泛的求解器支持能力是她的五大特點(diǎn)。同時(shí)作為ANSYS 家族的一款專業(yè)分析環(huán)境,還可以集成于ANSYS Workbench平臺(tái),與ANSYS系列產(chǎn)品無縫連接。
· CAD模型修復(fù)——輕松處理來自CAD模型的不完整曲面(俗稱“爛模型”)
· 中面抽取——自動(dòng)為來自CAD軟件的薄板模型抽取中面,用于殼單元網(wǎng)格劃分
· 網(wǎng)格雕塑——區(qū)別于其它軟件的“堆砌”技術(shù),可將任意復(fù)雜形體劃分成六面體網(wǎng)格
· 網(wǎng)格編輯——提高網(wǎng)格質(zhì)量、進(jìn)行網(wǎng)格類型變換的靈活工具
ANSYS ICEM-CFD是一款世界頂級(jí)的CFD前后處理器,為所有世界流行的CFD軟件提供高效可靠的分析模型。她除了提供其它軟件具有的普通前后處理功能外,強(qiáng)大的CAD模型修復(fù)能力、自動(dòng)中面抽取、獨(dú)特的網(wǎng)格“雕塑”技術(shù)以及網(wǎng)格編輯技術(shù)是她的四大特點(diǎn)。
AI Environment是融合了ICEM-CFD的所有優(yōu)點(diǎn)、重新整合界面、推廣到結(jié)構(gòu)有限元市場(chǎng)的新產(chǎn)品。
展開 干貨|降低芯片流片失敗風(fēng)險(xiǎn)的"七種武器"
最大限度利用已有經(jīng)驗(yàn)成果(IP和VIP),是芯片能夠越做越復(fù)雜的基石;什么東西都從頭開始做,特別類似標(biāo)準(zhǔn)接口的設(shè)計(jì)和驗(yàn)證,所有都是自研,陷入自我感動(dòng),偏離了芯片為了給客戶創(chuàng)造價(jià)值的初衷;
三:軟硬協(xié)同
賈老板讓工程師開發(fā)一個(gè)當(dāng)今世界上最牛的終端AI芯片,里面cpu, ddr, 總線,AI處理器,mipi,wifi網(wǎng)絡(luò)全都有,處理性能要求達(dá)到世界第一,賈老板可以出去吹牛。
自研的AI處理器的驗(yàn)證是通過UVM證明了A=B,完美;
外設(shè)可以通過VIP,把VIP的流程跑一遍,沒有問題,完美;
但是,這就夠了嗎?
這個(gè)事情就面臨一個(gè)問題,這個(gè)大芯片SOC的參考模型在什么地方?還記得UVM所需要的那個(gè)B嗎?誰又能來搞個(gè)參考模型B出來比對(duì)一下?不是任何情況下,都有一個(gè)完美的參考模型可以來比對(duì);芯片核心應(yīng)用場(chǎng)景是mipi采集來的圖像,緩存到ddr中,通過ai處理器識(shí)別成潛在犯罪分子,然后把犯罪分子圖像由cpu控制通過網(wǎng)絡(luò)上傳到后臺(tái)。所有部件的都參與上了,這需要怎么驗(yàn)證?
所有這一切都需要軟件和硬件配合才能實(shí)現(xiàn)場(chǎng)景的驗(yàn)證;
在復(fù)雜的SOC系統(tǒng)設(shè)計(jì)中,進(jìn)行硬件設(shè)計(jì)驗(yàn)證、軟件設(shè)計(jì)驗(yàn)證的同時(shí),實(shí)現(xiàn)軟硬件交互的設(shè)計(jì)與驗(yàn)證成為縮短設(shè)計(jì)周期,盡早完成系統(tǒng)設(shè)計(jì)的關(guān)鍵。
展開 飛行汽車輪胎概念設(shè)計(jì)
人工智能
該概念汽車輪胎還將采用嵌入式AI處理器,該處理器將輪胎傳感器的信息與車輛與車輛以及車輛與基礎(chǔ)設(shè)施之間的通信數(shù)據(jù)相結(jié)合。AI處理器將分析這些數(shù)據(jù)流,以建議采取的措施-允許車輛適應(yīng)飛行或駕駛模式-并在潛在的輪胎相關(guān)問題發(fā)生之前識(shí)別并解決。
隨著時(shí)代的發(fā)展,設(shè)計(jì)師們向天空尋求應(yīng)對(duì)城市交通和擁堵挑戰(zhàn),在先進(jìn)輪胎架構(gòu)和材料方面的工作讓我們想象出一種既可以作為公路上的傳統(tǒng)輪胎,又可以作為空中推進(jìn)系統(tǒng)的車輪。
手機(jī)AI芯片的諸神之爭(zhēng)
10天后,蘋果發(fā)布iPhone X,A12處理器上同樣搭載了芯片設(shè)計(jì)方面跟進(jìn)華為集成類似NPU模塊。這時(shí)業(yè)內(nèi)才發(fā)現(xiàn),獨(dú)立神經(jīng)網(wǎng)絡(luò)處理器已經(jīng)成了潮流。
華為為了搶NPU世界第一這個(gè)旗號(hào),動(dòng)作非常激進(jìn),特意把發(fā)布會(huì)提前到了蘋果iPhone X的前面。之后甚至也能看到一大批《蘋果A12處理器跟進(jìn)華為集成NPU,手機(jī)AI設(shè)計(jì)看中國》的類似文章出現(xiàn)。
事實(shí)上,蘋果和華為的規(guī)劃幾乎是在同期展開的。并不存在誰學(xué)誰的問題,華為的激進(jìn),目的在于做大國產(chǎn)芯片的市場(chǎng)口碑。搶到“全球首款獨(dú)立AI處理單元”的發(fā)布,這對(duì)麒麟處理器的營銷會(huì)有極大增益。
不可否認(rèn)的是,華為這種策略推動(dòng)了半導(dǎo)體產(chǎn)業(yè)對(duì)獨(dú)立神經(jīng)網(wǎng)絡(luò)處理單元的重視,也加劇了這個(gè)產(chǎn)業(yè)的競(jìng)爭(zhēng)。華為也愿意在神經(jīng)網(wǎng)絡(luò)處理單元軍備競(jìng)賽中和其他企業(yè)“打?qū)κ峙啤?。在今?月,聯(lián)發(fā)科推出搭載雙核APU處理器單元的P60之后,華為9月又在德國IFA展上發(fā)布了麒麟980,同樣搭載了雙核NPU。
這種軍備競(jìng)賽的策略,雖然有時(shí)會(huì)超出當(dāng)下需要,但是卻通過這種“過度競(jìng)爭(zhēng)”的方式,讓獨(dú)立神經(jīng)網(wǎng)絡(luò)處理單元得到了普及。
至此,有沒有獨(dú)立用于AI計(jì)算的處理單元,已經(jīng)成了考驗(yàn)手機(jī)處理器的核心要素。
和兩三年前手機(jī)處理器僅僅是性能堆疊不太一樣,獨(dú)立神經(jīng)網(wǎng)絡(luò)處理單元的出現(xiàn)讓性能堆疊的線形競(jìng)爭(zhēng)又上升了一個(gè)維度。
高通的保守
雖然華為很激進(jìn),相比行業(yè)其他廠商,高通顯得保守、遲疑很多。
在2017年年底亮相后,眾人大跌眼鏡,驍龍845基本還是沿襲上一代驍龍835的架構(gòu)。在AI方面,高通驍龍845并沒有專用于處理AI任務(wù)的NPU,而是拿出原本做ISP影像處理的Hexagon 685 DSP來處理AI應(yīng)用,性能不夠的時(shí)候再轉(zhuǎn)換使用GPU來應(yīng)付。
展開 英特爾的AI芯片戰(zhàn)略曝光
作為CPU(中央處理器)和Xeon微處理器制造商,英特爾開始接受這個(gè)挑戰(zhàn)。作為GPU(圖形處理器)制造商,英偉達(dá)也發(fā)起了進(jìn)攻。這兩家公司都在研發(fā)AI處理器。
英偉達(dá)的GPU已在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)解決方案市場(chǎng)攫取了很大一塊市場(chǎng)份額,例如圖像識(shí)別——這是人工智能在過去五年中最大的突破之一。但是,英特爾試圖通過收購Nervana、Mobileye和Movidius等公司來打造自己的AI處理器。在2016年,當(dāng)英特爾斥資3.5億美元收購Nervana公司的時(shí)候,它也聘用了Nervana公司CEO 那維恩-勞(Naveen Rao)。
勞是計(jì)算機(jī)架構(gòu)師和神經(jīng)學(xué)家,現(xiàn)在擔(dān)任英特爾人工智能產(chǎn)品部門副總裁和總經(jīng)理。近日在一次活動(dòng)中,勞宣稱,由于應(yīng)用AI技術(shù),英特爾Xeon CPU在2017年創(chuàng)造了10億美元營收。他認(rèn)為,到2022年,AI芯片市場(chǎng)將會(huì)達(dá)到80億到100億美元的規(guī)模。
為了達(dá)到這個(gè)目標(biāo),英特爾可能會(huì)從零開始設(shè)計(jì)AI芯片架構(gòu),從而搶在英偉達(dá)和其他初創(chuàng)公司的前面。近日在加州圣塔克拉拉舉行的英特爾數(shù)據(jù)中心創(chuàng)新峰會(huì)上,勞接受了采訪。下面是整理后的采訪內(nèi)容。
問:這里有一些非常有意思的數(shù)字。Xeon創(chuàng)造了10億美元營收。而在過去20年中英特爾銷售了超過2.2億臺(tái)Xeon處理器,創(chuàng)造了1300億美元的收入。這是一個(gè)很好的開始。
勞:在創(chuàng)業(yè)圈,這是一個(gè)很大的數(shù)字。你突然就變成了一個(gè)估值200億美元的公司。這個(gè)市場(chǎng)才剛剛啟動(dòng)。AI芯片市場(chǎng)真的才剛開始?,F(xiàn)在,我們將要進(jìn)入第二輪競(jìng)爭(zhēng)了。我們還有很長的路要走。
問:你的戰(zhàn)略似乎是AI芯片架構(gòu)需要重新設(shè)計(jì),而不同于CPU或GPU。
勞:從某種程度上來說確實(shí)如此。
問:在多大程度上是如此呢?
勞:我給你舉一個(gè)我們競(jìng)爭(zhēng)對(duì)手的例子。
展開 國內(nèi)首款存算一體大算力芯片,瞄準(zhǔn)智能駕駛!
下圖中右圖是存算一體電路的架構(gòu)圖,淺色部分是傳統(tǒng)的SRAM電路,深色部分是一些定制化的電路結(jié)構(gòu),包括乘法器、加法數(shù)、累加器等,做到數(shù)據(jù)讀取出來之后馬上可以在原地參與計(jì)算。
其次,H30芯片采用的是后摩智能自研的AI處理器架構(gòu)—IPU(Intelligence Processing Unit)。目前該IPU架構(gòu)規(guī)劃有三代:第一代是天樞架構(gòu),面向智能駕駛;第二代是天璇架構(gòu),它可以應(yīng)用于更多的場(chǎng)景;第三代是天璣架構(gòu),將面向通用人工智能。H30芯片采用的是第一代天樞架構(gòu)IPU。
解決了存和算的問題,在數(shù)據(jù)的傳輸方面:1)后摩智能專門設(shè)計(jì)了專用的數(shù)據(jù)傳輸總線,它能把各個(gè)Tile和各個(gè)IPU核連接起來,在它們之間建立高速的、直接的數(shù)據(jù)傳輸通道。2)在AI計(jì)算里,數(shù)據(jù)復(fù)用是一個(gè)非常重要的特性,因此,后摩智能為此設(shè)計(jì)了獨(dú)特的多波機(jī)制,避免了數(shù)據(jù)重復(fù)的讀取和傳輸。
通過存算電路底層技術(shù)的創(chuàng)新加上AI處理器架構(gòu)的創(chuàng)新,再加上出色的工程實(shí)現(xiàn)能力,最終鴻途H30實(shí)現(xiàn)了多項(xiàng)芯片性能指標(biāo)的突破。與某國際巨頭芯片對(duì)比,在工藝落后一代的情況下,進(jìn)行完全相同的測(cè)試,H30芯片的功耗減少了50%以上,性能卻有2倍以上的提升。
為了幫助客戶更好的落地,后摩智能同步推出了基于鴻途 H30芯片打造的智能駕駛硬件平臺(tái)——力馭(Sailing,寓意早日揚(yáng)帆起航)。僅依靠一顆H30芯片,力馭平臺(tái)的CPU算力高達(dá)200 Kdmips,AI算力高 256Tops,足夠支撐智能駕駛所有的傳感器。而且力馭平臺(tái)的功耗僅為85W,可采用更加靈活的散熱方式,實(shí)現(xiàn)更低成本的便捷部署。
展開 臺(tái)積電為何要進(jìn)軍存儲(chǔ)業(yè)務(wù)?
如在AI應(yīng)用方面,為了應(yīng)對(duì)越來越復(fù)雜的計(jì)算和處理需求,業(yè)績已經(jīng)提出了將存儲(chǔ)和AI處理器合二為一的想法,即將AI專用芯片集成在處理器當(dāng)中,以滿足實(shí)際需求。這樣來看,存儲(chǔ)器,特別是DRAM在整個(gè)系統(tǒng)當(dāng)中的權(quán)重在不斷提升。在傳統(tǒng)意識(shí)里,無論是PC還是手機(jī),存儲(chǔ)器只是用于配合CPU或AP,是配角,而隨著AI的成熟,這種狀況似乎要發(fā)生變化了,將來,我們或許很難區(qū)分,是AI處理器重要,還是存儲(chǔ)器重要,因?yàn)閷?shí)際應(yīng)用對(duì)存儲(chǔ)的要求越來越高,存儲(chǔ)與處理似乎也在朝著融合的方向發(fā)展了。
結(jié)語
如果臺(tái)積電真的要發(fā)展存儲(chǔ)業(yè)務(wù)的話,顯然要比其發(fā)展封測(cè)業(yè)務(wù)復(fù)雜得多,也正是因?yàn)槿绱?,這樣做更具開創(chuàng)性和發(fā)展?jié)摿Α?縱觀歷史和當(dāng)下,做存儲(chǔ)器的都是IDM,沒有Foundry,即使有,也只是曇花一現(xiàn),沒有成功的,這里說的存儲(chǔ)器是“大宗商品”,那些小容量的嵌入式產(chǎn)品不在談?wù)摲秶畠?nèi)。
作為全球Foundry霸主,臺(tái)積電如果進(jìn)入存儲(chǔ)器業(yè)務(wù),在某種程度上也是補(bǔ)上了這塊“短板”,當(dāng)然,情況不止如此,由于做存儲(chǔ)器的普遍是IDM業(yè)態(tài),無論其并購哪家存儲(chǔ)企業(yè),短期內(nèi)恐怕難以成為臺(tái)積電的主流業(yè)務(wù)板塊,估計(jì)還是以原有的、相對(duì)獨(dú)立的IDM狀態(tài)運(yùn)營。但如果僅僅是這樣,那么臺(tái)積電進(jìn)入存儲(chǔ)業(yè)務(wù)的意義似乎就沒那么大了。
而從長期來看,臺(tái)積電如果能將存儲(chǔ)業(yè)務(wù)做大,結(jié)合整個(gè)產(chǎn)業(yè)的聚合發(fā)展態(tài)勢(shì),是否會(huì)出現(xiàn)類似于傳統(tǒng)IDM,而又有所區(qū)別的、新形態(tài)的IDM呢?可能性還是有的。
來源:半導(dǎo)體行業(yè)觀察 張健
展開 
特斯拉三年“造芯”終見成果,每秒處理逾2000張圖像
再者,特斯拉為了提升汽車整體性能,所以自主研發(fā)最適合特斯拉車型的定制化AI芯片,力求功耗最低,成本最少以適應(yīng)量產(chǎn)。
每秒處理逾2000張圖像,打造最強(qiáng)自動(dòng)駕駛AI芯片?
馬斯克在電話會(huì)議中表示,NVIDIA的芯片每秒可處理200幀視頻(約200張圖像),這些畫面由汽車周圍的攝像頭拍攝所得。與大多數(shù)自動(dòng)駕駛公司不同,而特斯拉自主研發(fā)的芯片每秒可處理2,000幀畫面,在處理圖像之余,還留有一些剩余容量用于信息冗余和提高安全性,神經(jīng)網(wǎng)絡(luò)的運(yùn)算效率大幅提升。
在芯片技術(shù)上,特斯拉采用了“裸機(jī)級(jí)別”的技術(shù),而非分層GPU解決方案。以往基于CPU或GPU的自動(dòng)駕駛,都屬于仿真運(yùn)算。而特斯拉新采用的“裸機(jī)級(jí)別”最初是用于加速游戲機(jī)的圖形處理速度,即是直接通過視覺芯片來運(yùn)算。特斯拉重新設(shè)計(jì)計(jì)算器和存儲(chǔ)器電路,規(guī)避了總線帶寬可能帶來的數(shù)據(jù)擁擠,有助于加速傳輸數(shù)據(jù)。突破了GPU在仿真模式下運(yùn)行AI神經(jīng)網(wǎng)絡(luò)時(shí)的傳統(tǒng)瓶頸。
馬斯克對(duì)于采用的芯片方案表示,“AI芯片的關(guān)鍵在于能否運(yùn)行基本的神經(jīng)網(wǎng)絡(luò)。你必須在電路中做這些計(jì)算,而不是在某種模擬模式下,這就是GPU或CPU的工作方式。你要用這里的內(nèi)存做大量的計(jì)算?!?根據(jù)負(fù)責(zé)特斯拉硬件的內(nèi)部人員Peter Banon表示,這些芯片已經(jīng)在運(yùn)行中,特斯拉已經(jīng)為Model S,Model X和Model 3提供了替代產(chǎn)品。
除了自動(dòng)駕駛芯片之外,特斯拉自動(dòng)駕駛汽車從8月份開始將會(huì)升級(jí)到9.0車機(jī)系統(tǒng)。這個(gè)系統(tǒng)最大亮點(diǎn)是增加了“全自動(dòng)駕駛”。馬斯克表示用戶可以在車機(jī)上輸入目的地(家或公司),車輛隨即自動(dòng)導(dǎo)航至目的地。這一功能的增加,意味著特斯拉的人工智能得到增強(qiáng),汽車能夠知道自己如何去目的地以及走在哪條車道上等問題。
展開 賦能邊緣AI創(chuàng)新:新思科技聯(lián)手Innatera,以領(lǐng)先仿真技術(shù)助力類腦芯片開發(fā)
<ul><li>新思科技助力 Innatera 設(shè)計(jì)芯片,實(shí)現(xiàn)邊緣端的實(shí)時(shí)、高能效 AI 處理,加速推動(dòng)物理人工智能領(lǐng)域下一代應(yīng)用的開發(fā)</li><li>新思科技 PathFinder-SC? 簽核解決方案以更高精度提供更準(zhǔn)確的版圖級(jí)結(jié)果,專業(yè)管理設(shè)計(jì)需求,并支持早期階段分析</li><li>新思科技 Totem? 電源完整性平臺(tái)支持晶體管級(jí)分析,為超低功耗 AI 處理器提供可靠的電力傳輸與性能優(yōu)化</li></ul><p><br></p><p>面向傳感器邊緣超低功耗智能應(yīng)用的類腦神經(jīng)形態(tài)計(jì)算領(lǐng)域領(lǐng)導(dǎo)者 Innatera 公司宣布,選擇新思科技公司(NASDAQ股票代碼: SNPS)為其下一代神經(jīng)形態(tài)微控制器提供設(shè)計(jì)與驗(yàn)證支持。新思科技可靠的靜電放電(ESD)與電源完整性分析解決方案,將幫助 Innatera 擴(kuò)大其運(yùn)營規(guī)模,以滿足工業(yè)傳感器、機(jī)器人、可穿戴設(shè)備和智能家居等領(lǐng)域?qū)吘?em>處理快速增長的需求。</p><p>神經(jīng)形態(tài)微控制器通過模擬生物神經(jīng)元通信方式的脈沖神經(jīng)網(wǎng)絡(luò)(SNNs)來處理信息,在傳感器邊緣實(shí)現(xiàn)類腦智能。這種事件驅(qū)動(dòng)的方法能夠在傳感器密集、對(duì)響應(yīng)速度和能效要求極高的環(huán)境中實(shí)現(xiàn)實(shí)時(shí)、超低功耗運(yùn)行。Innatera 的架構(gòu)結(jié)合了混合信號(hào)模擬計(jì)算、密集互連以及低電壓設(shè)計(jì)——這些都是實(shí)現(xiàn)高能效的關(guān)鍵因素,但也可能成為電噪聲和 ESD(靜電放電)敏感性的潛在來源。為解決這些挑戰(zhàn),并確保在復(fù)雜神經(jīng)形態(tài)電路中實(shí)現(xiàn)穩(wěn)健性能,Innatera 利用 PathFinder-SC 和 Totem 來驗(yàn)證電源完整性、管理噪聲耦合、并在不犧牲速度或效率的前提下維持可靠性。</p><p>PathFinder-SC 可在大規(guī)模芯片上模擬 ESD 事件,在最終設(shè)計(jì)進(jìn)入制造階段前識(shí)別潛在弱點(diǎn)與根本原因,確保芯片在面對(duì)實(shí)際靜電沖擊時(shí)能發(fā)揮最佳功能。
展開 一文看全:全球99家AI芯片公司全景圖
Adapteva
Adapteva獲得了510萬美元的資金,論文“Epiphany-V:一個(gè)64位RISC片上系統(tǒng)1024核處理器”描述了Adapteva公司采用16nm FinFet技術(shù)設(shè)計(jì)的1024核處理器芯片。
Knowm
Knowm實(shí)際上是一家ORG,但他們似乎在追求營利。到目前為止,這家新成立的公司已經(jīng)獲得了數(shù)目不詳?shù)姆N子資金,用于開發(fā)一個(gè)新的計(jì)算框架AHaH Computing(Anti-Hebbian and Hebbian),這項(xiàng)技術(shù)旨在將智能機(jī)器學(xué)習(xí)應(yīng)用程序的大小和功耗降低9個(gè)數(shù)量級(jí)。
Mythic
Mythic正在開發(fā)一種AI芯片,它“將桌面GPU計(jì)算能力和深度神經(jīng)網(wǎng)絡(luò)植入一個(gè)紐扣大小的芯片——功率低50倍,數(shù)據(jù)處理能力也遠(yuǎn)超競(jìng)爭(zhēng)對(duì)手”
Kalray
Kalray推出了Kalray Neural Network 3.0 (KaNN),一個(gè)AI應(yīng)用開發(fā)平臺(tái)。KaNN允許開發(fā)人員將基于AI的算法從著名的機(jī)器學(xué)習(xí)框架(包括Caffe、Torch和TensorFlow)無縫地移植到Kalray的大規(guī)模并行處理器陣列(MPPA)智能處理器上。
BrainChip
BrainChip 是第一家提供脈沖神經(jīng)處理器(Spiking Neural processor)的公司,目前的設(shè)備被稱為BrainChip加速器,是一種用于快速學(xué)習(xí)的芯片。
AImotive
AImotive和合作伙伴VeriSilicon正在設(shè)計(jì)一款22 nm FD-SOI測(cè)試芯片,Aimotive的另一個(gè)有趣的項(xiàng)目是神經(jīng)網(wǎng)絡(luò)交換格式(NNEF)。
展開 官網(wǎng)百萬年薪招攬人才,瞄準(zhǔn)AI芯片
整體來看,芯片技術(shù)崗大約有15+個(gè),分為硬件和軟件兩種,硬件上包括芯片架構(gòu)、芯片設(shè)計(jì)、硬件電子開發(fā)、FPGA等,軟件則包含AI編譯器、芯片底層軟件等。
技術(shù)需求上,確實(shí)如騰訊所說,招聘方向基本都與專用芯片相關(guān)。
芯片分為兩個(gè)大類,通用芯片包括CPU、GPU、DSP;專用芯片包括FPGA、ASIC(包括AI芯片,即針對(duì)AI算法的ASIC)。
其中,硬件如芯片架構(gòu)師,主要負(fù)責(zé)AI芯片和通用處理器或是細(xì)分領(lǐng)域的需求分析,主導(dǎo)AI處理器芯片架構(gòu)設(shè)計(jì)、競(jìng)爭(zhēng)分析和規(guī)格定義,也負(fù)責(zé)主導(dǎo)關(guān)鍵技術(shù)研究。
FPGA開發(fā)工程師則包括設(shè)計(jì)、開發(fā)FPGA代碼,配合軟件工程師聯(lián)調(diào)軟硬件,要求有5年以上經(jīng)驗(yàn),且熟悉相應(yīng)的FPGA芯片開發(fā)流程。
芯片驗(yàn)證工程師則主要負(fù)責(zé)FPGA、芯片兩塊的驗(yàn)證工作,需要從驗(yàn)證環(huán)境、方案開始搭建。
軟件如AI編譯器工程師,則主要負(fù)責(zé)AI編譯器架構(gòu)設(shè)計(jì)、AI芯片工具鏈開發(fā)、算子開發(fā)DSL語言設(shè)計(jì)等。
薪資上,騰訊官網(wǎng)并未給出具體的薪資數(shù)額,不過從BOSS直聘上發(fā)布的部分崗位來看,騰訊芯片相關(guān)的崗位月薪2萬起步,最高能達(dá)到10萬(16薪),基本是目前行業(yè)的平均水平。
△圖源BOSS直聘
工作經(jīng)驗(yàn)上,基本要求都在5~10年,甚至更長;芯片大牛更是優(yōu)先列入考慮范圍內(nèi),“設(shè)計(jì)公司一線技術(shù)專家優(yōu)先考慮”。
展開