GPU圖形處理器行業深度研究報告:GPU研究框架!

一、GPU投資邏輯框架

處理器芯片經歷了從專用到通用,再從通用到專用的2次轉變。其中,可存儲指令的馮?諾依曼體系和1971年X86 CPU的誕生是第一次轉折的誘因;摩爾定律的減速和以GPU為代表的異構運算的崛起是第二次轉折的誘因。異構時代,芯片需集成多個模塊來滿足不同的需求。例如汽車芯片集成了GPU、CPU、NPU等至少10種處理單元。

GPU被廣泛地運用于PC、游戲主機、汽車、服務器、移動等領域。其中注重算力的服務器和注重便攜性的移動端分別 采用獨立和集成GPU,而汽車、游戲主機、PC等主要采用獨立+集成的GPU接入方式。全球GPU市場表現為寡頭壟斷下的高增長,年復合增速超過30%,主要市場份額被英偉達等美系企業占領。在此宏觀 背景下,國產GPU企業蓬勃發展,在GPU軟硬件方面同時出擊,呈現“星星之火,可以燎原”之GPU是數字芯片,基于制程越小,性能越好的規律,GPU產業鏈是先進制程數字芯片產業鏈。 當前國產GPU產業鏈進口替代:設計環節,景嘉微等龍頭在不斷追趕,封測環節,通富承接AMD 7nm GPU封測,14nm及以下結點的先進制程,設備、材料、EDA/IP、制造等環節與國外領先龍頭差距較大, 目前仍采用“外循環為主+內循環為輔式。

GPU產業鏈的巨頭大多集中在海外,它們位居產業鏈各個環節核心,對全球GPU行業起著決定性的作用。設計環節:NVIDIA、AMD幾乎壟斷獨立GPU的市場,英特爾、AMD幾乎壟斷集成GPU市場、材料 、EDA/IP等環節國內龍頭與國外龍頭差距較大,國產化率較低;制造環節:目前只有臺積電和三星有5nm 制程生產能力,但均需使用美國設備;封測環節:目前中國臺灣、中國大陸、美國三分天下。

二、詳解GPU:專用計算時代的“畫師”

GPU(graphics processing unit)圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種在個人電腦、 工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。GPU通常包括圖形顯存控制器、壓縮單元、BIOS、圖形和計算整列、總線接口、電源管理單元、視頻管理單元、 顯示界面。GPU的出現使計算機減少了對CPU的依賴,并解放了部分原本CPU的工作。在3D圖形處理時,GPU采用的核心技 術有硬件T&L(幾何轉換和光照處理)、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四 像素256位渲染引擎等,而硬件T&L技術可以說是GPU的標志。

軟件生態方面,GPU無法單獨工作,必須由CPU進行控制調用才能工作,而CPU在處理大量類型一致的數據 時,則可調用GPU進行并行計算。所以,GPU的生態和CPU的生態是高度相關的。 近年來,在摩爾定律演進的放緩和GPU在通用計算領域的高速發展的此消彼長之下,通用圖形處理器( GPGPU)逐漸“反客為主”,利用GPU來計算原本由CPU處理的通用計算任務。目前,各個GPU廠商的GPGPU的實現方法不盡相同,如NVIDIA使用的CUDA(compute unified device architecture)技術、原ATI的ATI Stream技術、Open CL聯盟、微軟的DirectCompute技術。這些技術可以 讓GPU在媒體編碼加速、視頻補幀與畫面優化、人工智能與深度學習、科研領域、超級計算機等方面發揮異 構加速的優勢。以上4種技術中,只有OpenCL支持跨平臺和開放標注的特性,還可以使用專門的可編程電路 來加速計算,業界支持非常廣泛。

從芯片設計思路看,CPU是以低延遲為導向的計算 單元,通常由專為串行處理而優化的幾個核心組成, 而GPU是以吞吐量為導向的計算單元,由數以千計 的更小、更高效的核心組成,專為并行多任務設計。CPU和GPU設計思路的不同導致微架構的不同。 CPU的緩存大于GPU,但在線程數,寄存器數和 SIMD(單指令多數據流)方面GPU遠強于CPU。微架構的不同最終導致CPU中大部分的晶體管用于 構建控制電路和緩存,只有少部分的晶體管完成實際 的運算工作,功能模塊很多,擅長分支預測等復雜操 作。GPU的流處理器和顯存控制器占據了絕大部分 晶體管,而控制器相對簡單,擅長對大量數據進行簡 單操作,擁有遠勝于CPU的強大浮點計算能力。

過去20多年里,GPU的基本需求源于視 頻加速,2D/3D游戲。隨后GPU運用自 身在并行處理和通用計算的優勢,逐步開 拓服務器、汽車、礦機、人工智能、邊緣 計算等領域的衍生需求。 雖然GPU無法離開CPU獨立運作,但是在 當前“云化”加速的時代,離開了GPU的 CPU也無法勝任龐大的計算需求。所以 GPU和CPU組成了異構運算體系,從底層 經由系統軟件和驅動層支持著上層的各種 應用。GPU已經成為了專用計算時代的剛 需。

GPU的供給涉及設計、制造、封測三個主要環節,整體供給模式有IDM和Fab+Fabless兩種。IDM模式將設計、制造和封測集中在一起,代表廠商有英特爾。Fab+Fabless模式的代表有AMD設計,臺積電制造,通富 微電封測;ARM陣營的蘋果設計,臺積電制造,日月光封測。目前GPU的先進設計、先進制造主要被美系、韓系和中國臺灣所控制。中國大陸企業華為和中芯國際遭到美國實體清單限制 ,未來發展艱難。封測方面,長電科技和通富微電已經掌握先進封測技術,已經有能力為蘋果、AMD提供封測技術支持。

汽車GPU的用例幾乎涵蓋了從ADAS到自動駕駛,從儀表到中控信息系統等多個車載系統。在實際大規模量產領域 ,基于深度學習的ADAS系統是GPU的主力戰場。不同于消費級GPU,汽車GPU需要滿足諸如AEC-Q100等車規認證,快速生成冗余備份,在冗余備份中進行二次 處理,確保功能的安全執行。安全關鍵圖形和計算能力是下一代車載系統的要求。為了提高汽車GPU的速度,實現 圖形和視頻流之間快速切換,汽車GPU需要專用的圖形API,如Imagination專用汽車GPU的OpenGL?SC?2.0 API。通過GPU的硬件虛擬化解決方案,多屏幕、多操作和多個應用程序都能在一個GPU上運行而沒有性能損失。隨著汽車的含硅量上升、功能的多樣化,汽車CPU將和汽車GPU組成SoC,從分布式向中心化發展,統籌計算整車 數據。以新能源車的標桿特斯拉為例,下代HW4.0將同時集成ADAS(先進輔助駕駛)、電動汽車動力傳動、車載 信息娛樂系統和車身電子四大功能。汽車GPU作為主要算力的提供方,對整個汽車行業具有決定性作用。目前汽車GPU可以分為2派。其一,是以特斯拉為代表的“自主”派,采用類似于蘋果公司的模式,自主設計芯片 ,不對外開放技術,軟硬件的整合在公司內部完成。其二,是以英偉達為代表的“開放”派,采用類似于安卓的模 式,對外開放技術,服務其他車企,自己不造整車。具體模式的選擇需要綜合地權衡靈活性和契合度。

服務器GPU,即在服務器中使用的GPU,它從底層支持著整個服務器產業鏈。服務器GPU被廣泛應用于AI 、數據分析、高性能計算與渲染等領域。不過服務器是網絡中的重要設備,要接受少至幾十人、多至成千 上萬人的訪問,因此對服務器GPU具有大數據量的快速吞吐、超強的穩定性、長時間運行等嚴格要求。在AI服務器領域,相較于其他運算單元,服務器GPU因較高的可編程性和不錯的通用性能,被用作特定應 用處理器(ASP),部署在云端、辦公室、數據中心、邊緣計算。目前,主要的服務器GPU解決方案有英偉達的DGX、EGX、HGX等平臺;AMD的Instinct M100 GPU 解決方案。這些服務器GPU被廣泛用于戴爾、惠普、技嘉、超微的服務器產品。

縱觀全球智能手機和平板市場,智能手機的出貨量在 12億部以上,是同期平板出貨量的8倍以上。隨著移動通訊進入5G時代及5G技術的親民化,5G手 機的換機將帶動整個手機市場復蘇。預計未來5年手 機的出貨量將保持1.7%的同比增長,2024年出貨量 將超過14億部。? 全球智能手機CPU基本全部采用ARM指令集。截至 2020Q3,聯發科和高通是最主要的手機SoC供應商 ,市場份額分別為31%和29%。截至2020Q2,全球平板電腦的SoC大部分采用ARM 指令集,占比超過50%,還有部份使用Windows系 統追求高性能的平板采用英特爾的X86處理器,占比 18%。

游戲主機的設計思路完全不同于PC。通常每個世代游戲主機的核心部件如CPU、GPU、DRAM等硬件的性能指標是不變的 ,而且主機存在成本控制、體積、12V供電等物理限制因素,所以游戲主機的硬件性能不會領先于同期高端桌面處理器。游 戲主機的畫質、音效、操控等實際體驗非??粗亻_發人員對CPU、GPU等硬件優化和底層API等軟件優化。在上述一系列限制因素的共同作用下,同時集成了較高性能CPU和GPU的AMD定制化“APU”成為了索尼和微軟的首選, 而任天堂的Switch采用英偉達的Tegra芯片。以索尼PS5為例,它的GPU搭載了以RDNA2微架構為基礎的36組運算單元和 Zen2 CPU共用16GB GDDR6 DRAM,主頻最高2.23GHz,可以提供10.3TFLOPS的算力,是前代PS4的5.6倍。在索尼獨家 Game boost、GNM底層API和GNMX高級API等技術支持下,兼容前代PS4和PS4 Pro的游戲,支持光線追蹤、4K 120赫 茲HDR游戲、8K顯示。

PC GPU主要分為集成GPU和獨立GPU。目前,大部分集成GPU已經和CPU被設計為一顆SoC,二者通過 SoC內部的高速總線實現互聯,而獨立GPU多采用PCIe總線與CPU實時通訊。當前,集成GPU主要由英 特爾和AMD提供,獨立GPU主要由AMD和NVIDIA提供。PC的GPU需求不同于追求多路互聯和“交火”的服務器GPU,不同于追求高度穩定的汽車GPU,不同于 追求省電和小體積的手機/平板GPU。PC的GPU需要在性能、拓展性、能效方面做到平衡。擁有先進制程 和封裝,TDP(熱設計功耗)15-25W的集成GPU或獨立GPU可以滿足輕薄筆記本電腦的圖形需求,TDP 25-150W 的獨立GPU可以滿足游戲本的圖形需求,TDP75-320W的獨立GPU可以滿足臺式的圖形需求。2020年英特爾在其架構日中首次推出Xe GPU架構。Xe微架構可以滿足從集成/入門圖形需求到數據中心 和高性能計算的需求。Xe的推出標志著英特爾向高性能獨立顯卡領域的擴張。

三、知己知彼:GPU的全球格局與行業龍頭

2020年全球GPU市場價值預計為254.1億美元,預計2027年將達到1853.1億美元,年平均增速為32.82%。按GPU的類型進行劃分,市場可以細分為獨立、集成和混合。2019年,集成GPU占GPU市場的主導地位,但是由 于混合GPU同時擁有集成和專用GPU的能力,所以混合細分市場預計實現最高復合增長率。按GPU的設備進行劃分,市場可細分為計算機、平板電腦、智能手機、游戲機、電視、其他。就收入而言,智能手 機細分市場占比最大,在未來也將保持這一趨勢。但是,由于醫療等其他設備中對小型GPU的需求不斷增加,預計 未來的年復合增長率將最高。按GPU的行業進行劃分,市場可細分為電子、IT與電信、國防與情報、媒體與娛樂、汽車、其他。由于GPU在設計 和工程應用中的廣泛使用,預計汽車細分行業的年復合增長率最高。按GPU的地理區域劃分,市場可細分為北美、歐洲、亞太和其他地區。亞太地區在2019年主導了全球GPU市場, 預計在整個預測期內將保持主導地位。

全球GPU已經進入了寡頭壟斷的格局。在傳統GPU市場中,排名前三的Nvidia、AMD、Intel 的營收幾乎可以代表整個GPU行業收入。英偉達的收入占56%、AMD占26%、英特爾占18% 。 在手機和平板GPU方面,聯發科、海思麒麟、三星Exynos的GPU設計主要基于公版ARM Mali GPU或PowerVR微架構。高通驍龍Adreno和蘋果A系列采用自研GPU微架構。2019Q2,ARM、高通、蘋果、Imagination科技、英特爾是全球智能手機和平板的前五大 GPU供應商。同期ARM Mali在以上五大GPU供應商中占43%的市場份額,高通Adreno占36% 的份額,蘋果占12%的份額。

四、國產GPU自主之路:詳解國產GPU

國產GPU的發展落后于國產CPU,直到2014年4月,景嘉微 才成功研發出國內首款國產高性能、低功耗GPU芯片— JM5400。在國產GPU的開發中,GPU對CPU的依賴性和 GPU的高研發難度,阻礙了該產業的快速發展。首先,GPU對CPU有依賴性。GPU結構沒有控制器,必須由 CPU進行控制調用才能工作,否則GPU無法單獨工作。所以 國產CPU較國產GPU先行一步是符合芯片產業發展邏輯的。再者,GPU技術難度很高。Moor Insights & Strategy首席 分析師莫海德曾表示:“相比CPU,開發GPU要更加困難, 而GPU設計師、工程師和驅動程序的作者都要更少?!眹鴥?人才缺口也是國產GPU發展緩慢的重要原因之一。在芯片行 業,一般來說,培養一位擁有豐富經驗并且能夠根據市場動 態及時修改芯片設計方案的成熟工程師,至少需要10年。

中國GPU市場規模和潛力非常大,龐大的整機制造能力意味著巨量的GPU采購。雖然近些年,計算機整機和 智能手機產量增長都出現瓶頸,但由于這兩類產品體量龐大,2019年國內智能手機出貨量為3.72億部,電子 計算機整機年產量達到3.56億臺,GPU的需求量大且單品價值非常高,市場規模依然非??捎^。同時,服務器GPU伴隨著整機出貨的快速成長,需求量增長也較為迅速。據統計,2018年國內服務器出貨量 達到330.4萬臺,同比增長26%,其中互聯網、電信、金融和服務業等行業的出貨量增速也均超過20%。另外 ,國內在物聯網、車聯網、人工智能等新興計算領域,對GPU也存在海量的需求。 據統計,近年來中國集成電路自給率不斷提升,2018年為13%,預計2020年有望提升至15%,但仍然處于 較低水平。根據國務院印發的《新時期促進集成電路產業和軟件產業高質量發展的若干政策》等文件,中國 芯片自給率要在2025年達到70%,這將產生8000億元的國產芯片需求。中國芯片產業發展空間非常大。

報告節選:

GPU圖形處理器行業深度研究報告:GPU研究框架!的圖1


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖2


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖3


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖4


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖5


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖6


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖7


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖8


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖9


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖10


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖11


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖12


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖13


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖14


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖15


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖16


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖17


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖18


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖19


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖20


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖21


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖22


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖23


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖24


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖25


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖26


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖27


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖28


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖29


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖30


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖31


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖32


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖33


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖34


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖35


GPU圖形處理器行業深度研究報告:GPU研究框架!的圖36

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

4
1