
發布
注冊
/
登錄計算架構的案例
Moldex3D模流分析之并行計算架構
Moldex3D Linux 并行計算架構
?Linux節點叢集
先決條件:
1.例如:你的賬號是peter ,你有你的主目錄: /home/peter。
2.//home/peter 是網絡共享的,因此所有加入并行計算的節點都可以存取 /home/peter。 (這是NFS提供的功能。)
3.您(peter)可以透過SSH登入所有加入并行計算的節點,無需輸入密碼。 (這是NIS和SSH提供的功能。)
4.所有節點都知道其他節點的IP和主機名的映像。 (這是DNS提供的功能。)
5.計算節點需要連接到Windows授權節點以獲取授權。
?只有 1 個 Linux 節點
先決條件:
?例如:你的賬號是peter ,你有你的主目錄: /home/peter。
?Linux 操作系統的必備條件
Moldex3D 2024 支持的 Linux 版本
?CentO Linux 7或8系列 (64位)
?Rocky Linux 8系列 (64位)
?RHEL (Red Hat Enterprise Linux) 7或8系列 (64位)
展開 馮諾依曼瓶頸漸顯,未來的計算架構如何發展?
在本文中,我們主要是評估基于憶阻器模式的新型計算系統的優勢與劣勢,以及在未來中是否能夠超越摩爾定律,取代現有計算模式。未來將會從憶阻器開發中獲益匪淺的主要有三種類型的計算系統,如圖2所示:片上存儲(on-chip memory and storage),神經網絡模式(biologicallyinspired computing)和存儲計算(in-memory computing)。基于憶阻器的計算模式可以幫助克服當今計算架構面臨的障礙,并且能夠用于未來的計算需求:認知處理,大數據分析和基于物聯網的低功耗智能系統等計算系統。
圖2:未來計算解決方案的競爭
傳統的計算架構面臨著各種挑戰,包括散熱,存儲和摩爾定律。憶阻器技術可以提供一種替代路徑,實現存儲-邏輯集成,神經網絡計算和高效的內存計算系統。CMOS,互補金屬氧化物半導體; GPU,圖形處理單元; CPU,中央處理單元。
馮諾依曼瓶頸?
現今,傳統計算結構面臨的挑戰源于存儲能力瓶頸以及存儲器與處理器之間的特定的數據轉移速度所帶來的高成本,即為馮·諾伊曼瓶頸。憶阻器模式則直接提供了一種超高密度存儲解決方案,并且可直接與處理芯片集成,減少內存瓶頸,顯著提高系統的能效和計算速度。
與靜態隨機存取存儲器(SRAM)和動態隨機存取存儲器(DRAM)相比,憶阻器(以RRAM的形式)比硬盤驅動器和閃存快得多,同時存儲密度更高,成本更低,且具有良好的非揮發存儲性能。此外,晶體管模式的存儲器不同,憶阻器式存儲可以與處理器進行高密度低熱功耗集成,消除了傳統模式那種緩慢且耗能的片外通信。這些特性使得憶阻器模式能夠簡化存儲層次結構,并顯著提升計算系統性能,特別是在大數據時代。
展開 從芯片到軟件,從算力到架構|AUTO TECH China 2026 中國國際汽車計算技術展覽會
AUTO TECH China 2026 中國國際汽車計算技術展覽會
時間:2026年11月27日-30日
地點:廣州·廣交會展館D區
亞洲領先的汽車計算技術與核心器件展
——是與來自世界各地的汽車工程師們交流的最佳平臺!
中國國際汽車計算技術展覽會是 AUTO TECH China 2026 重點專題之一,將于2026年11月27日-30日在廣州·中國進出口商品交易會展館D區盛大舉辦,重點展示計算芯片、通信技術、連接器、車規級電源管理器件、高速存儲器件、軟件等相關產品,通過展覽+論壇和現場演示,共同探討如何釋放計算平臺功能價值,提升智能汽車的安全性、可靠性與用戶體驗。屆時組委會邀請諸如廣汽、日產、豐田、本田、比亞迪、特斯拉、小鵬、蔚來、理想、東風、長安、上汽、吉利、長城、奇瑞、小米、奔馳、寶馬、大眾、一汽、寧德時代、博世、大陸、電裝、德賽西威、華為技術等汽車主機廠及一級零部件供應商的上萬名采購、技術工程師匯聚一堂,參加展會以尋求供應商及合作伙伴。
展示范圍:
1. 汽車計算平臺與芯片 (Automotive Computing & Chips)
計算平臺:自動駕駛中央計算平臺、座艙域控制器、域控制器(DCU)、區域控制器(Zone Controller)、高性能計算集群。
汽車芯片/半導體:主控芯片(SoC)、MCU、GPU、FPGA、AI芯片、功率半導體(IGBT/SiC)、傳感器芯片、存儲芯片。
2.
展開 駕駛域計算平臺架構核心軟件和底層硬件梳理
三大圖商的高精度地圖訂單梳理
數據來源:四維圖新公司公告(參見:2019年2月13日《四維圖新:關于與寶馬汽車公司簽署自動駕駛地圖許可協議的公告》及2019年11月20日《四維圖新:關于華為采購公司高精度地圖數據產品和服務的公告》),汽車之家,蓋世汽車,廣發證券發展研究中心
二、底層硬件梳理
(一)底層硬件采用異構分布架構(以華為 MDC 為例)
智能駕駛域控制器是結合車輛線控平臺和大量多類型外圍傳感器的核心部分,具有多樣的接口類型、足夠的接口數量和高性能等特點。多傳感器數據融合、人工智能算法等技術對域控制器的接口和算力性能都有著更高要求,因此,域控制器需要采用集成多種架構芯片的異構多核芯片的硬件方案。
異構多核芯片硬件架構主要由具有AI單元、計算單元和控制單元三部分組成。
AI單元:為異構芯片硬件架構中算力最大的一部分,通過系統內核進行加速引擎和軟硬件資源的分配、調度。AI 單元主要完成多傳感器融合數據的分析和處理,輸出用于規劃、決策和控制的周圍環境信息。目前,主流的 AI芯片可選架構有 GPU、FPGA、ASIC 等。
計算單元:基于多核CPU的計算單元具有主頻高,計算能力強等特點,通過系統內核管理軟件和硬件資源、完成任務調度。計算單元主要用于執行大部分自動駕駛相關的核心算法,整合多傳感器融合數據完成路徑規劃、決策控制等功能。
控制單元:主要基于傳統車輛控制器(MCU)完成車輛動力學橫縱向控制任務,搭載基礎軟件平臺的控制單元將各個車輛控制的功能軟件連接起來實現車輛控制,同時,軟件系統需要預留與智能車輛操作系統集成的通信接口。
展開 
Moldex3D高效能運算之遠端計算 (Remote Computing)前言
? 遠程計算 (Remote Computing)
遠程計算 (RC) 是由計算管理器 (Computing Manager) 和工作排程器 (Job Scheduler) 所組合而成,遠程計算協助使用者及管理者調度和執行工作分析。下面各節將詳細介紹遠程計算各模塊,并在附錄上說明每個按鍵功能。 基于在并行計算小節中以提到關于非服務器版本Windows的連入聯機數量限制的因素,強烈建議使用這在遠程計算的主節點上安裝服務器版本的Windows。
遠程計算架構
在遠程計算的架構中,我們定義了三個角色,即:客戶端、主節點、計算節點。
Moldex3D 2023 工作排程器會在主節點打開兩個靜態通訊端口并等待連接。10190埠用來讓客戶端的計算管理器發送命令,10119埠除了讓計算節點的求解器發送結果之外也用來讓主節點的工作排程器發送命令。當計算管理器開始進行上傳/下載作業時,會透過22埠與主節點的OpenSSH server通訊。
在Moldex3D的計算管理器跟工作排程器之間所有的交流都是加密的。對于計算節點來說,10019埠的作用是和工作排程器交流。工作排程器會透過此通訊端口取得每個計算節點的數據。
布局1:三個角色分別位于不同臺計算機
布局2:主節點和計算節點位于同一臺計算機
布局3:所有角色位于同臺計算機上
Moldex3D提供3種遠程計算模式
?叢集(DMP)模式
叢集(DMP)模式的適用于一或多個客戶端、一個主節點和多個計算節點的環境。
?在此模式下,必須設定一個共享的文件夾與網絡聯機。
?此外,在進行并行計算時需要有憑證(賬號),使用者可以使用現有的賬號或新創一個賬號。
叢集(DMP)模式建議的的配置如同布局1。
展開 一文盤點博世、豐田、特斯拉等6家主流智能汽車電子架構
面向未來智能汽車的基于功能域控制器 集中化的架構、基于區域控制器和中央計算的架構和基于環形主干網和多域計算架構的方案都是可行方案。滿足L2/L3等級高級駕 駛輔助功能需求的集中化域的電子電氣架構將成為主流解決方案。在面向更高自動駕駛等級時,基于環形主干網和多計算中心架構方案與其它兩種方案相比,在網絡安全,冗余備份等方面更具優勢,在技術上也更具有挑戰性。
一文盤點博世、豐田、特斯拉等6家主流智能汽車電子架構
面向未來智能汽車的基于功能域控制器 集中化的架構、基于區域控制器和中央計算的架構和基于環形主干網和多域計算架構的方案都是可行方案。滿足L2/L3等級高級駕 駛輔助功能需求的集中化域的電子電氣架構將成為主流解決方案。在面向更高自動駕駛等級時,基于環形主干網和多計算中心架構方案與其它兩種方案相比,在網絡安全,冗余備份等方面更具優勢,在技術上也更具有挑戰性。
轉載自智能網聯汽車網,文中觀點僅供分享交流,不代表本公眾號立場,如涉及版權等問題,請您告知,我們將及時處理。
-- END --
展開 Gen-Z入門指南
邁向新的計算架構
如圖1所示,計算架構正在迅速發展為異構系統,包括多種計算單元(CPU / SoC,GPU,FPGA)和不同類型的內存/存儲元件(DRAM,存儲器),在本地互連在一起或遠程通信。
此類體系結構應通過允許添加或刪除資源,或在更新版本/技術可用時替換此類資源來提供更好的靈活性和可伸縮性。
圖1 - 新的計算架構
以CPU為中心的方法
利用當今以CPU內存為中心的方法,圖1中的系統使用各種硅組件、接口和軟件層實現,如圖2所示。
圖2 - 以CPU內存為中心的系統架構
在計算系統的這種特定實現中,PCI Express被用來連接CPU內存、GPU / FPGA內存和高性能/低延遲存儲器。SSD陣列通過主機總線適配器或NIC連接,使用光纖通道、Infiniband、NVMe-oF或以太網作為傳輸接口。
其中一個CPU的DRAM中的數據必須在到達SSD陣列之前遍歷4個接口域,隨后會產生相關的軟件開銷和緩沖區復制操作。
這里,可擴展性是一個問題:升級到下一代SCM可能需要升級/更換相關的CPU / SoC。同樣,擴展SSD陣列可能需要HBA / NIC下游的結構交換機。
內存語義方法
Gen-Z是一種內存語義結構,它將CPU內存字節可尋址的加載/存儲模型擴展到整個系統。事實證明,加載/存儲模型是CPU與內存子系統通信的最快、最有效的方法。為了啟用此模型,Gen-Z將計算與介質分離,將介質特定功能與其正確所屬的介質放在一起。圖3說明了這個原理。
展開 第一款96核4.8GHz--超頻工作站GR450P上市
§ 配備6個GPU卡(全部PCIe 5.0 x16接口),最大GPU CUDA 6.4512萬核數(FP32 :280Tflops)、Tensor Core 2016個核數(FP16 2184Tflops),完美的GPU超算架構
§ 配備基于PCIe 5.0總線的海量并行存儲(最大容量300TB),延遲低,支持最大15個并行讀,硬盤io性能大幅提升,性能和管理遠超傳統的DAS/NAS存儲系統
§ 不需要專門的機房,不占過多空間,維護成本極低
§ 不需要作業調度系統,管理難度大幅降低
§ 完全處于辦公環境(靜音級)、不在被噪音所困擾
配置規格
計算架構與技術優勢
? 擁有豐富的核數+大緩存+高帶寬,支持虛擬并行計算加速,比常規計算架構速度快3倍以上
? 完美異構超算架構(多核+高頻+多pcie 5.0 接口),應用面更寬,計算性能到極致
? 應用更廣泛,滿足多核+高頻計算需求
? 高可靠、高穩定性,保證計算設備長期穩定運行
? 計算即巔峰
應用領域匯總
APP1 計算類
1) 數值模擬、數學建模
2) CAE仿真計算(結構仿真、多物理場耦合、電磁仿真)
3) 油藏模擬、地質建模、地震模擬
4) 天體物理模擬、核物理、粒子物理模擬、地球科學模擬
5) 天氣預測和氣象模型
6) 光學仿真、光子學仿真
7) 金融建模和風險分析、量化交易、高頻交易
8) 量子化學計算、分子動力學
9) 大數據分析、數據挖掘
APP2 數字內容創作類
1) 4K/8K影視后期(剪輯、特效、調色、渲染)
2) 3D建模及渲染
3) 視頻編解碼、音頻編輯
APP3 虛擬機類
§ 基于虛擬機(并行計算、圖形設計、圖像處理
展開 結構、流體、熱分析、多物理場耦合、電磁仿真硬件配置探討-1
問題分析:
首先 不同算法有不同的計算特點,另外整個求解過程,數據預處理與并行求解交叉推進,CPU很多計算過程不是全部100%的運行,
其次, 傳統工作站通常是 (1)核數少頻率高、 (2)核多頻率低、 (3)核數嚴重不足、(4)核數太多,(5)僅有CPU計算架構,沒有GPU超算配置,
上述機器和算法計算要求,嚴重不匹配,這樣性能上不去,求解效率很低,怎么辦,是否有那種理想的配置架構?
被AMD收購后,FPGA的未來如何?賽靈思CEO這樣說
這跟計算架構演進密切相關。當高性能高效率計算變得越來越重要,異構計算架構下CPU+FPGA兩個通用計算平臺可以非常好的融合串行計算與并行計算的優勢,關于這部分的內容可以參考筆者雙方交易達成時的分析。
作為第四任賽靈思的CEO,上任三年多的Victor Peng在交易后首次面對中國的媒體時,除了總結自己上任三年來的成績之外,更是重點的回應了對合并后企業的愿景“與AMD合并,將為我們提供一個更大的平臺,助力我們賦能為更多創新型人才和創新型初創企業”。
賽靈思CEO Victor Peng
作為全球第一家FPGA企業和第一家Fabless企業,賽靈思的出現引領了諸多半導體和計算領域的革命。如果按照之前雙方交易的進程規劃,2021年底完成正式的整合,那么賽靈思的歷史將會定格在37歲。回顧賽靈思37年來四任CEO的業績,我們不難發現每個階段的掌舵人都完美地將個人特點與企業發展融合為一體。
首任CEO也是公司共同創始人 Jim Barnett與FPGA發明者Ross Freeman一起用獨創的Fabless模式成功將賽靈思這顆種子呵護壯大;
第二任CEO Wim Roelandts帶來的豐富行業經驗讓FPGA在消費、汽車、工業和國防等多元化市場快速生根發芽,并將公司的業績在十年左右時間里擴大了5倍;
前一任CEO Moshe Gavrielov作為EDA領域的老兵,任期內則是大舉推行FPGA工具的軟件化以及FPGA架構的軟件化,可以說正是在擁抱軟件時代這個關鍵節點的領先一步讓賽靈思在市場份額上逐步甩開老對手Altera。
展開 
快如閃電----圖靈超算工作站
目錄
(1)圖靈超算工作站介紹
(2)典型應用配置方案
最快仿真計算配置方案推薦
大型三維設計中心超級圖形工作站推薦
8K視頻剪輯、特效合成、渲染、調色工作站配置推薦
(一)圖靈超算工作站產品介紹
隨著專業應用深入,對精度要求越來越高,如仿真計算、分子模擬、傾斜攝影建模、8K視頻后期剪輯,計算設備需要一種CPU既有足夠數量的核數,還有非常高的頻率,這樣才更理想,機器使用率最大程度發揮到極致,英特爾CPU分兩大系列:酷睿至尊系列和Xeon系列,前者核數少頻率高,后者通過兩顆或四顆架構,提供足夠多的核數,但頻率偏低,在上述應用中沒中不足
圖靈超算工作站是2019年3月上市一款采用大排量工業級水冷散熱系統、真正滿負荷、準靜音級高頻計算工作站,該機器配備intel Xeon X-3175X系列處理器(28核4.8GHz)、最大512GB內存容量、四顯卡架構。
完美適合那些對單核頻率極高同時具備一定核數做并行計算要求的中大規模應用,整個機器在超高頻狀態下,單核計算與多核并行計算、GPU超算、高速讀寫保證軟件各個環節完美運行,從而大幅縮短整體計算或處理時間。
展開 冷凍電鏡(cryo-EM)三維圖像重構軟件Relion工作站配置探討
單顆粒冷凍電鏡是結構生物學研究的重要手段之一,冷凍電鏡的模型重構通常需要對幾萬甚至幾十萬張投影圖片進行分析、組裝和優化,計算量巨大,這需要先進的計算架構配合有效的算法才能實現。
Relion是專門為低溫電子顯微鏡(cryo-EM)設計的圖像處理軟件。由MRC分子生物學實驗室的Sjors Scheres組開發的Relion框架正在革新冷凍電磁領域。該軟件在通過電子冷凍顯微鏡數據的單顆粒分析來優化大分子結構。Relion采用經驗貝葉斯方法對多個3D重建或2D類平均值進行細化。借助GPU CUDA并行計算架構,改進了算法,GPU解決了Cryo-EM中計算量最大的過程,例如粒子自動選取,2D和3D圖像分類以及高分辨率圖像細化。
展開 提升半導體制造水平的新障礙:數據處理
近年來,由于大規模數據庫的性能變化和架構能力的進步,這項活動已成為主流,” Onto Innovation軟件產品管理總監 Mike McIntyre 說。“由于這些數據庫現在可以超過 100 或200 TB,它們仍然可以有效地及時檢索請求的數據。在數據進入數據庫之前幫助處理和清理數據的工具,以及普通用戶可以導航以訪問這些數據的界面,有助于使這些大型數據存儲變得更加有價值。”
信息和智能制造技術的推動者
工程師總是重視更多的數據,但它需要有上下文來支持實時和數月甚至數年的決策。數據存儲和數據庫架構提供了進行工程查詢的基礎。計算選項緊隨其后,它們需要考慮正在做出的決策類型。
這些決定從簡單到復雜不等,后者提高了對計算架構的要求。統計過程控制圖和產量儀表板等標準分析分別有助于對工廠運營和產品健康狀況進行一般監控。將其提升一個檔次是能夠在晶圓圖中組合大量測試數據,然后允許深入識別異常和工具歷史特征。
二十多年來,工程團隊一直依靠機器學習進行晶圓和封裝檢測。但是,連接更多不同數據集的前景——檢查、晶圓測試、單元測試、工具歷史——促使工程師和數據分析平臺供應商通過深度學習計算深入研究數據海洋。
為了滿足高質量和可靠性的期望,100% 檢測正在擴展到更多的晶圓層和組裝工藝步驟。這導致要管理和使用的數據顯著增加。傳統上,工程師使用這些數據作為特定設備和處理步驟的反饋。現在,它們正在為某些應用程序前饋檢查數據,以增強測試中的通過/失敗決策。
展開 John Glossner:新一代異構計算正在成為人工智能的加速引擎,中國是全球異構計算生態的重要一
如果按照馬云的觀點,數據是人工智能的生產資料,計算是人工智能的生產力,那么異構計算就是提升人工智能生產力的引擎。
9月17日,在2018世界人工智能大會的主論壇上,全球異構系統架構(HSA)聯盟主席John Glossner博士發表了《面向人工智能的新一代異構計算標準》的演講。John Glossner在演講中以華夏芯(北京)通用處理器技術有限公司的異構多核處理器平臺為例,介紹了最新的人工智能芯片的設計趨勢。他還表示,中國是全球異構計算生態的重要一環。異構計算是一種將不同指令架構的計算單元(例如傳統的CPU、GPU、DSP、還有創新的TPU、DLA等)融合在一起、實現高效協同運行的計算技術。如果說傳統架構的芯片是一種燒汽油的引擎,那么異構計算的芯片就是一種混合動力引擎,甚至新能源引擎。
John Glossner主席認為,大量人工智能應用的出現,如無人駕駛、機器視覺、智能手機等等,對于人工智能的發動機——芯片,提出了非常高的要求,包括性能、功耗、成本、應用開發等等。芯片既是人工智能持續增長的動力引擎,又是人工智能規模化商用的算力瓶頸。面對大數據、人工智能對計算性能的爆發式需求,各種創新的神經網絡算法及相應的計算實現架構層出不窮,之前的傳統芯片設計架構已經難以滿足應用對計算能力的需求。正因為如此,不僅眾多創新的芯片公司,甚至包括亞馬遜、百度這些互聯網公司都在開始設計新架構的人工智能芯片。異構計算這種將傳統與創新架構融合、通用和專用計算協同的技術路徑,非常好地滿足了人工智能芯片不僅要性能好、成本低,還要可演進、易開發的設計理念。因此,業界的共識是新一代異構計算架構是未來人工智能芯片設計創新的主要突破口。
異構計算并不是全新的概念,但由于產品設計難度大、生態系統需要重新構建等挑戰,在過去很長一段時間里一直處在不斷演進當中。
展開