不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

計算機芯片架構的案例

David Patterson:現在是發展新的計算機架構的黃金時代!
Patterson說,目前應用這樣的新架構和新語言的最大機會領域是機器學習。“如果你是做硬件的,”他說,“你會想要迫切需要更多電腦的朋友。”機器學習“對計算是貪婪的,我們愛它這一點”。 他說,如今圍繞哪種類型的計算機架構最適合機器學習展開了激烈的爭論,許多公司都下了注。Google有張量處理器(TPU),它每個芯片一個核,使用軟件控制的內存而非緩存; Nvidia的GPU有80多個核;而Microsoft正在采用FPGA方法。 他說,Intel“正試圖在所有籃子里下注”,向機器學習營銷傳統的CPU,收購Altera(向Microsoft提供FPGA的公司),以及收購擁有其專門的神經網絡處理器的Nervana(此處理器類似于Google的TPU)。 Patterson說,除了這些為機器學習提供不同架構的大公司外,至少有45家硬件初創公司正在解決這個問題。他說,最終將由市場決定什么會留下來。 他說:“這是計算機架構的黃金時代。”
展開
汽車芯片需要怎樣的處理器架構
傳統上,這些較大SoC中的汽車MCU是基于RISC的架構。然而,為了滿足性能要求,系統需要一種具有最先進的安全功能的處理器架構,這種架構是一種平衡了性能、功耗、面積、安全等多個因素的組合。這種組合將為未來汽車行業內的先進安全設計以及未來其他生死攸關的安全應用奠定基礎(圖2)。 圖2.
深度解讀特斯拉自研芯片架構
本文來源:半導體行業觀察 / 導讀 / 對于一家自動駕駛電動汽車制造商來說,花費數億美元從頭開始創建自己的人工智能超級計算機,超大規模人工智能訓練的成本和難度有多大?公司創始人必須多么自負和肯定才能組建一支能夠做到這一點的團隊? 像許多問題一樣,當您準確地提出這些問題時,他們往往會自己回答。很明顯,SpaceX 和特斯拉的創始人兼 OpenAI 聯盟的聯合創始人埃隆馬斯克沒有時間或金錢浪費在科學項目上。 就像世界上的超級大國低估了完全模擬核導彈及其爆炸所需的計算能力一樣,也許自動駕駛汽車的制造商開始意識到,在復雜的世界中教汽車自動駕駛這種情況總是在變化,這將需要更多的超級計算。一旦你接受了這一點,你就可以從頭開始,建造合適的機器來完成這項特定的工作。 簡而言之,這就是特斯拉的 Project Dojo 芯片、互連和超級計算機工作的全部內容。 關于Dojo系統 在Hot Chips 34大會上,曾在Dojo超級計算機上工作的芯片、系統和軟件工程師首次公開了該機器的許多架構特性,并承諾將在特斯拉AI日上談論Dojo系統的性能。 Emil Talpes 在 AMD 工作了近 17 年,研究各種 Opteron 處理器以及命運多舛的“K12”Arm 服務器芯片,他介紹了他的團隊創建的 Dojo 處理器。Debjit Das Sarma 則同期在 AMD 擔任 CPU 架構師,他在演講中受到贊譽,目前是特斯拉的自動駕駛硬件架構師,Douglas Williams 也是如此,我們對他一無所知。
展開
汽車芯片需要怎樣的處理器架構
傳統上,這些較大SoC中的汽車MCU是基于RISC的架構。然而,為了滿足性能要求,系統需要一種具有最先進的安全功能的處理器架構,這種架構是一種平衡了性能、功耗、面積、安全等多個因素的組合。這種組合將為未來汽車行業內的先進安全設計以及未來其他生死攸關的安全應用奠定基礎(圖2)。 圖2.
計算機芯片架構圖1
AI芯片架構競相走向邊緣
芯片的面積和功率的目標規格將在明年上半年完成,并在下半年流片。推理引擎將充當CPU,而不僅僅是一個更大,更漂亮的加速器。它提供了模塊化、可擴展的架構,旨在通過減少移動數據的需要以及通過改進數據和矩陣計算的加載方式來減少瓶頸,從而降低移動數據的時間和精力成本。 該芯片將DRAM專用于單個處理器塊,而不是將其作為一個大內存池進行管理。DRAM不能同時將數據饋送到芯片的多個部分。Tate說:“將DRAM作為流入一個處理器塊的大內存池處理,這是范諾依曼架構的典型特征,但它不會成為神經網絡的成功架構。” 早期 Wawrzyniak表示,Xilinx,Flex Logix和其他公司蜂擁到了一個仍處于發展中的邊緣推理市場,顯示出市場和SoC、FPGA制造商提供良好技術以應對它們的能力的廣泛信心,但這并不能保證他們能夠克服安全、隱私、現狀的慣性和其他無形的問題。同樣,FPGA、ASIC和SoC加速ML的市場仍處于起步階段。 Linley Group的Linley GwenNap表示,當一個新市場發展起來時,看到許多新的參與者和新方法是正常的。FPGA和ASIC供應商也在其中,因為這些技術使一家知道自己在做什么的公司能夠快速生產出合理的產品。不過,標準最終將在一兩年內回歸,這將穩定所涉及的參與者的數量和專長,并確保與其他市場的互通性。 來源:半導體行業觀察(ID:icbank)翻譯自「Semiconductor Engineering」
展開
主流芯片架構即將變天!
結論 通過實現這些方法中的一部分或全部,芯片廠商說他們可以每兩年將芯片的性能提高一倍,從而跟上數據的爆炸式增長,同時保持芯片的功耗在一定范圍之內。 這實現絕不僅僅是更多的計算機。它是整個芯片設計和系統工程的改變的起點,從此芯片開始跟隨數據的增長,而不是受限于硬件和軟件。 Synopsys的主席和副CEO Aart de Geus說:“當計算機進入公司時,許多人感到整個世界發展得太快了。他們當時還在一摞紙上進行會計工作。從那時就開始了指數級別的增長,而現在我們又會見到同樣的事情。 現在發展的東西,你可以認為就是當年由會計賬本向穿孔卡片的演化。在農田里,你必須在正確的日期、氣溫上升的時候澆水施肥,這就是為什么以前機器學習沒有帶來明顯進步的原因。” 并不只他一個人給出了這種評價。西門子的子公司Mentor的總裁和CEOWally Rhines說,“人們最終會接受新架構。新架構最終會被設計出來。多數情況下這些架構會包含機器學習,就像你的大腦能從經驗中學習一樣。我見過20多家公司利用他們自己特質的AI處理器,每一種都有特定的用途。但你現在會在越來越多的應用中看到他們,最終他們會挑戰傳統的馮諾依曼架構。神經元計算會成為主流,這是我們在提高計算效率、降低成本并提高移動性和互聯性方面的一大步。” 來源:本文由 CSDN 翻譯自「Semiconductor Engineering」
展開
網絡芯片架構的新改變
Walia表示:“無論是CPU芯片組、GPU、加速器、適配器卡、交換機、存儲陣列還是安全系統,根據它們的功能,又會出現不同的要求。第三,從PHY的角度來看,它們在系統中的位置很重要,無論是在刀片服務器卡內,還是在中間卡上,或是在交換機架的頂部。所以它們的位置決定了它們的需求。市場整體上非常分散,因為它變得越來越復雜。” Walia說,除此之外,還有一群開發人員在談論芯片,因為它們被逼到了芯片裸片尺寸或光罩的邊緣。“他們現在想要進入chiplets,我們正在從那些想要做所謂的USR(超短距離)SerDes的客戶那里獲得需求。這是另一個需要解決的市場。” 今天,大多數網絡設計活動都在云端,其中大部分都是由AI和機器學習應用驅動的。Walia表示:“有趣的是,所有網絡公司現在都在嘗試遵循垂直整合模式,他們甚至在嘗試自己制作芯片組。無論是中國的阿里巴巴、騰訊、百度,還是美國的Facebook、谷歌,都在嘗試自己的AI芯片組。他們不想使用商業芯片。因此,至少從IP的角度來看,我們的業務指標不是芯片量。更多的是從設計開始的,當然,我們在此處看到了云計算驅動了我們大部分IP業務。” 西門子Mentor事業部IP部門總經理Farzad Zarrinfar對此表示贊同:“基本的處理器并沒有達到要求,所以我們看到主要的OEM、搜索領導者、游戲領導者和通信領導者都在開發他們自己的ASIC。顯然,這些ASIC很多取決于應用。如果它是數據中心應用,或是某種汽車應用,亦或物聯網應用,我們就會看到很多構建模塊。例如,如果你觀察一個三層千兆交換機,那么你就會發現1千兆位和10千兆位MAC(媒體訪問控制器)。有些人在芯片內部加入了ASIC、收發器、SerDes和PHY,以進一步提高整合度,并最大限度地降低成本。有些人希望基于自己的架構來保持它。
展開
自動駕駛主流芯片及平臺架構:低算力平臺
從上圖的roadmap 可以看到,在ADAS芯片這塊,瑞薩推出的芯片比較慢,在2018-2020年都是基于R-Car Gen3 架構推的ADAS芯片。R-Car Gen3基于Arm?Cortex?-A57 / A53內核,該內核使用Arm 64位CPU架構。它提供了處理來自車輛周圍多個傳感器的大量數據的能力。在開發入門級或高端系統時,在圖形和計算機視覺方面存在權衡。 在2018年推出的芯片是R-CAR V3M,這顆芯片是一款主要用于前置攝像頭應用的SoC,前置攝像頭面臨的挑戰是如何為計算機視覺提供高性能,同時支持低功耗和高水平的功能安全。由于前置攝像頭緊靠擋風玻璃安裝,因此必須考慮部件本身產生的熱量以及陽光直射造成的溫度升高。從而對低功耗的要求尤為嚴格。R-Car V3M 解決了這一難題,提高了攝像頭系統開發的功效。 2019年推出第二個視覺 SoC,即 R-CAR V3H,該產品具有高性能的視覺處理能力和AI處理能力,并具有業界領先的低功耗,該產品的目標應用是L3和L4級別的自動駕駛中的前置攝像頭的應用。新一代R-Car V3H產品針對立體前置環視應用做了優化,比R-Car V3M在視覺處理方面的性能提高了5倍。
展開
系統和芯片架構正在走向異構世界
架構的核心是組塊陣列,每個組塊相互連接,有各自的本地存儲,而且可以擴展,以針對特定的應用。Xilinx將提供一系列針對廣闊的新市場的SKU。可編程邏輯將包括DSP、LUT、URAM和BRAM。根據Peng的設想,該架構將允許用戶對架構進行編程,以最好地滿足應用的需求。這使得組織能夠將相同的芯片部署到不同的工作中。 Peng 表示:“這將使內核和DSA進出的速度更快,同時減少設計限制。它適用于多個市場。關于數據中心和云有很多討論,但由于其靈活性和深度,它將服務于所有市場。該架構是可擴展的,因此它將用于汽車應用、云應用,以及介于兩者之間的東西,例如通信、基礎設施。它不僅軟件可編程,硬件也可編程。” 它還將帶來更高的吞吐量、更低的延遲和更低的功耗,在談論現代工作任務時,這些因素都與頻率一樣重要。 Peng 表示:“如今,尤其是由于人們對機器學習的關注,我們陷入了對于尖端技術的狂熱。這讓我想起了上世紀90年代的兆赫戰爭。這真的不重要,重要的是應用的加速。我們運行這些東西通常是幾百兆赫或一千兆赫左右,并不會太高。原因在于,由于我們的架構普遍具有適應性,我們有很多分布式片上存儲器和連接性可以自定義,甚至端口的部分配置也可以自定義。你不僅可以優化數據路徑和數據流,還可以優化內存層次和帶寬,以及大量的片上帶寬。”
展開
方之熙:RISC-V架構將是我國物聯網芯片逆襲機會
先是計算機主機(IBM)時代:1946年ENIAC計算誕生,1964年IBM宣布了360計算機,獨占了這個市場;再是個人電腦(Intel+Microsoft)時代:1981年IBM—PC英特爾8088+微軟的DOC推出,1994年第一臺配置Pentium處理器的筆記本電腦東芝T4900CT、1995年ThinkPad760cd問世;現在是智能手機(ARM+iOS/Android)時代:2002年Symbian操作系統智能手機諾基亞7650發布,2006年蘋果公司發布iOS的iPhone,2008年谷歌推出Android手機操作系統。 方之熙回憶,上世紀80年代從主機進入到PC時,在英特爾推出PC芯片的同時,市場上有十幾二十家企業在做CPU,而英特爾的芯片當時在技術上也不是最好的,英特爾之所以能夠一統江湖,是因為英特爾和微軟聯手控制了系統架構,決定了運算平臺,運算平臺控制了整個軟件生態。在CPU設計中,有很多約定,包括核和核之間如何通信、需要幾個時鐘等,如果沒有在英特爾是不知道的,因為它不是系統架構約定的,而是在實現的時候定下來的,而英特爾的微系統架構是不對外公開的,這其中有很多的軟件接口、總線與緩存的知識產權。英特爾擁有了大部分IP,其他人很難繞過去,很難躲開。再加上與微軟兩者的聯手的WINTEL一統天下之后,其他的CPU廠商很難打進這個市場去。 另外一個例子是關于服務器芯片。上世紀九十年代,英特爾在PC芯片市場大獲全勝,是非常賺錢的公司。然后,英特爾希望進入新的市場領域。在上個世紀末這個世紀初,對于新市場拓展的方向,重點是做服務器芯片還是做手機芯片,英特爾公司進行了長時間的認真討論,因為人力物力財力所限,在服務器芯片和手機芯片上英特爾公司重點投入也只能二選一。
展開
AI芯片技術架構的4種類型,哪種能笑到最后?
02、基于FPGA的半定制化芯片   代表如深鑒科技DPU、百度XPU等   DPU:Deep-Learning Processing Unit深度學習處理器   Deephi Tech深鑒,一家位于北京的清華背景start-up,深鑒將其開發的基于FPGA的神經網絡處理器稱為DPU。   深鑒已經公開發布了兩款DPU:亞里士多德架構和笛卡爾架構,分別針對CNN以及DNN/RNN。   百度也發布了XPU,這是一款256核、基于FPGA的云計算加速芯片,合作伙伴是賽思靈(Xilinx)。XPU的目標是在性能和效率之間實現平衡,并處理多樣化的計算任務。   XPU的256個內核,集成了一個共享內存用于數據同步,所有內核都運行在600MHz   03、全定制化ASIC芯片   代表如TPU、寒武紀 Cambricon-1A等   ASIC:Application Specific Integrated Circuit   ASIC在集成電路界被認為是一種為專門目的而設計的集成電路。ASIC芯片技術發展迅速,目前ASIC芯片間的轉發性能通常可達到1Gbs甚至更高,于是給交換矩陣提供了極好的物質基礎。   TPU:Tensor Processing Unit Google 的張量處理器   Google在2017年5月的開發者大會上正是公布了TPU2,又稱Cloud TPU.相比于TPU1,TPU2既可以勇于training,又可以用于inferrence.TPU1實用了脈動陣列的流處理結構。   
展開
計算機芯片架構圖2
Arm推出Armv9架構芯片產品最快年底面世 華為也能用
Arm近日宣布推出Armv9架構,以滿足對安全、人工智能和無處不在的專用處理的需求。這也是Armv8之后十年來最新的Arm架構。 基于Arm架構芯片出貨量在持續加速,過去五年基于Arm架構的設備出貨量超過1000億。Arm在Armv9中提供更多的安全性和性能,順應AI、物聯網和5G在全球范圍內的發展,加速每個產業應用從通用計算轉向專用計算。 Arm首席執行官Simon Segars表示,“在展望由AI定義的未來時,我們必須夯實先進的計算基礎,以應對未來的獨特挑戰。Armv9就是我們給出的答案。在通用計算所具備的經濟性、設計自由度和可及性的基礎上,市場需要普適專用、安全而強大的處理能力,這將驅動下一個3000億個基于Arm架構芯片發展,而Armv9就是這些芯片的技術先驅。” 在安全、AI和性能進行升級 芯片最快年底面世 在安全方面,Armv9架構路線圖引入了Arm機密計算架構。機密計算通過打造基于硬件的安全運行環境來執行計算,保護部分代碼和數據,免于被存取或修改,甚至不受特權軟件的影響。 Arm機密計算架構將引入動態創建機密領域的概念,機密領域面向所有應用,運行在獨立于安全或非安全環境之外的環境中,以實現保護數據安全的目的。
展開
Arm公布全新芯片架構Cortex-A76AE,叫板自動駕駛競爭對手
自動駕駛汽車和未來的信息娛樂系統將需要更智能,更安全的芯片,而ARM正在通過新的芯片組和安全平臺來說明為什么它應該成為聯網汽車的核心。該公司透露了新的ARM Cortex-A76AE以及ARM Safety Ready計劃,該計劃承諾將幫助汽車制造商,ADAS開發商和一級汽車供應商更快地將他們的車輛和部件推向市場,同時確保車輛在道路上自動駕駛的安全性。 當然,這不是ARM首次涉足汽車行業。該公司的芯片設計已經在運行信息娛樂系統,高級駕駛員輔助等等。實際上,已經用于運行ADAS技術的芯片當中65%是基于ARM的設計。ARM表示,汽車正在成為最復雜的電子產品,從動力總成到發動機車身控制器,輪胎壓力監控器和汽車座椅控制器。所有這些都是在基于ARM的平臺上提供。 ARM今天公布的全新芯片Cortex-A76AE。 “AE”是“汽車增強型”的縮寫,“汽車增強型”是ARM為車載處理設計的芯片組代號。它基于7nm工藝制造,并嚴格關注功耗。事實上,ARM提供250+ KDMIPS的性能,功率約為15W。 它還將展示ARM的新安全芯片設計Split-Lock。它首次用于汽車用途,它允許組成Cortex-A76AE的多個處理器內核通過冗余鎖定在一起以實現安全,或者分開以獲得更高的處理能力。 例如,Cortex-A76AE有四個CPU內核。 Split-Lock會將它們鎖定為兩對,每個都會運行相同的指令。通常,自動駕駛或高度輔助車輛中的冗余系統依賴于多個芯片組。單獨的“CPU checker watchdog SoC”用于比較兩個內核的結果,并標記是否存在問題。 ARM說,問題在于軟件的復雜性,延遲和龐大的整體設計。相比之下,ARM的Split-Lock將允許同一SoC上的分離群集和鎖定群集。在同一個SoC上也可以支持“安全島” - 通常是低功耗的Cortex-R。
展開
三星開始為特斯拉下一代自動駕駛計算機生產芯片
即將推向市場的特斯拉Cybertruck將首次使用特斯拉最新的Hardware 4計算機 —— 韓國媒體的報道稱,三星將擊敗臺積電,獲得生產該計算機所使用的芯片的合同。 特斯拉當前所生產的電動汽車,搭載的是HW 3.0芯片,這一款芯片也是由三星電子代工。作為HW 3.0芯片的繼任者,HW 4.0芯片也將用于多款特斯拉電動汽車。 從外媒的報道來看,三星將獲得的是HW 4.0芯片的代工合同。
芯片帝國架構:英偉達GPU獨占風騷,英特爾掉隊、谷歌奮力追趕
CPU、GPU、FPGA、英特爾、英偉達、賽靈思等等隨著深度學習帶來的AI的興起,芯片領域最近可謂是風起云涌,一個個科技名詞走進公眾視野,成為網紅。AI創企也在不斷吸金,用芯片燃燒著一個又一個神話;與此同時,老牌芯片廠商,英偉達、賽靈思也在不斷被挑戰的同時,續寫自己的輝煌。 芯片,作為高端制造業的“皇冠明珠”,在不斷變小、改變架構的同時,不斷凝縮著新的科技結晶,逐漸構建出更龐大、更精致的科技帝國。 億歐推出“芯片帝國”系列分析稿件,從芯片的核心架構、應用場景、國內外主要玩家和下游晶圓代工廠等方面呈現芯片業的產業圖景。當前AI芯片主要分為GPU、FPGA、ASIC及類腦芯片等。以下為第一篇架構篇,從通用芯片CPU及它的創始者英特爾說起,梳理AI浪潮下不同的芯片架構,及它們所構筑的科技帝國。 英特爾和CPU:開山鼻祖,集成通用芯片、PC界老大 芯片中,最令人熟悉的恐怕是中央處理器CPU了。作為一種超大規模的集成通用芯片,CPU可完成多種不同種類的任務,在PC世界里起著大腦的作用。而CPU的誕生也開始了PC時代的巨頭——英特爾的輝煌歷史。 英特爾是主要以研制CPU處理器的巨頭,全球最大的個人計算機零件和CPU制造商,1971年,英特爾推出了全球第一個微處理器,它引發的微處理器所帶來的計算機和互聯網革命,可以說改變了整個世界。 但CPU雖統治了PC時代,隨著人工智能興起,傳統的CPU算力不足這一問題便越來越突出,尤其基于CPU的傳統計算架構無法滿足人工智能并行計算的需求。AI所需的深度學習需要很高的內在并行度、大量浮點計算能力以及矩陣運算,因此在通用芯片之下,需發展適合人工智能架構的專屬芯片。這也帶來了英特爾地位的下降。
展開