
發布
注冊
/
登錄64核
關注創建者:Treesa 創建時間:2023-08-08
64核的視頻教程
64位Win10(20H2版)Deform安裝及多核設置過程
01 deform安裝前的準備環境~此節免費, 02 deform安裝過程 以及安裝過程注意事項; 03 多核設置過程,大家最關心的多核設置的方法,以及出現問題的排除方法等;
¥29.9 28分鐘 1632播放
查看
64核的實例教程
最近看到“澎峰科技”的微信公眾號,看到他們發布了第一款RISC-V服務器,芯片是算能的SG2042,帶64個RISC-V核心(阿里平頭哥的C910v核),2.0GHz主頻,最大支持128GB內存。這應該算是全球第一款RISC-V服務器吧,找了一些資料。和大家一起品品。
處理器采用貼片,不是那種socket。沒什么好評論的。
看來芯片沒有集成顯卡。需要外接顯卡。
主板的外觀、布局和工藝,還是有一定水準的。
好奇,澎峰科技不是做計算軟件的公司嗎?還能設計和生產主板,厲害了。算能找他們合作是對的,國內的處理器公司,數學庫的性能就是一坨屎。RISC-V高性能計算有澎峰科技加持數學計算庫,還是很靠譜的,OpenBLAS全世界知名的開源項目。
讓我們看看算能SG2042的內部架構圖
2G主頻,尚可吧,飛騰好像是2.1GHz
三級Cache還OK了
DDR通道4條偏少,應該干到至少8個通道。
PCIE Gen4,想想飛騰、海光還在Gen3的水平,還是不錯的。
CCIX,這個好!能支持2或4處理器互聯,內存共享還是相當彪悍。
功耗120w,還好,還好。
我申請了他們的云測試賬號(要嘗鮮的可以加這個微信試試,iYuta-R2),我簡單做了stream的測試,性能算中規中矩,不能期望第一款芯片就能超過intel、amd這些大牌,但卷卷國內的"信創CPU",應該還是有一戰之力的。
單核模式,訪存性能吃不滿。單核性能可以在打磨打磨。
多核模式,如果按照38GB/s,那么每個處理器核只能分到0.59GB/s(38GB/64核),還是得8個DDR通道,多線程模式性能才不至于被訪存帶寬給困住。
展開 這個版本, 在某種意義上, 超越了 MAGMASOFT
在64位操作系統運行, 可以識別, 運算超過 4G物理內存 ( 薄壁, 曲面, 超大型鑄件, 不怕不怕了:-D )
MAGMA 雖然也有多核計算版本, 但是內核計算模塊是 32位, 在 WINDOWS 操作系統, 只能用到3G物理內存計算(BOOT.INI 打開3GB開關)
從4核到64核,不同并行規模下,計算用時均明顯少于其他兩個平臺。此外,“神工坊”高性能工業仿真平臺在使用16核的計算速度就超過了其他仿真云平臺在32、64核的計算速度。反觀其他仿真云平臺,仿真云平臺1在使用8、16、32核是仿真計算所用的時間幾乎一樣,在使用到64核時時間才有所減少。仿真云平臺2在使用到64核的時間比使用32核時的時間更長。
同時,我們在隱式求解分析時,對各個平臺的并行效率也進行了分析對比。以每個仿真云平臺4核的計算時間為基本單位,計算各個平臺的并行效率,結果如下所示。可以發現“神工坊”高性能工業仿真平臺的并行效率在大多數情況下是高于其他仿真云平臺的。
結論
綜上所述,“神工坊”高性能工業仿真平臺(點擊了解詳情)在進行Abaqus隱式求解分析時,
無論是計算時間還是并行效率,均優于其他平臺的
。
“神工坊”高性能工業仿真平臺基于超算HPC集群的硬件支撐,對仿真軟件進行了CPU的適配與優化,不僅實現了仿真軟件跨節點大規模并行計算,還減少了仿真計算所需的時間,極大的縮短了在工程上結構設計中強度、剛度校核所需時間,減少工程中對產品設計以及優化的時間。(本文作者:趙振)
點擊查看《‘神工坊’高性能仿真云平臺和其它云平臺的區別!》
十四五期間,工業數字化將是工業轉型升級的主路線。“神工坊”秉持“算力賦能、協同創新”的理念,爭做“先進算力到仿真算能的轉換器”、“離散機理和垂直仿真場景的連接器”,助力我國工程仿真技術實現跨越發展,支撐重大裝備研制創新和工業設計研發數字化轉型。
展開 仿真結果
迭代完成之后仿真云圖如下所示:
仿真平臺對比
我們進行Fluent旋轉機械穩態分析時,“神工坊”高性能工業仿真平臺與其他兩家仿真云平臺的硬件參數如下表所示:
計算過程中三個平臺的一些輸出日志如下圖所示:
本次仿真并行規模分別選取了16核、32核、64核、128核(受限于另外兩個平臺無法進行跨節點并行,并行規模無法進一步擴大),我們在SimForge?平臺進行了256核等更大規模的并行計算,結果顯示計算用時會進一步縮短。SimForge?高性能仿真云平臺與其他幾家仿真云平臺的計算時間如下圖所示,其中,由于仿真云平臺2最高只能64核并行使用,故圖表中無仿真云平臺2并行規模為128核的結果。
可以發現,SimForge?高性能工業仿真平臺在進行穩態仿真分析時,表現出了絕對的速度優勢。從16核到128核,其仿真計算速度都明顯優于其他仿真云平臺,且在相同并行核數下其仿真計算時間僅為其他仿真云平臺的1/2不到,尤其是在64核并行時,其仿真計算時間更是只有仿真云平臺1的1/3左右。我們以每個仿真云平臺16核的計算時間為基本單位,計算各個平臺的并行效率,結果如下圖所示。我們可以發現SimForge?高性能仿真云平臺的并行效率也是優于其他仿真云平臺,且在每個核數下都保持著較高的并行效率。
展開 仿真結果
迭代完成之后仿真云圖如下所示:
仿真平臺對比
我們進行Fluent旋轉機械穩態分析時,“神工坊”高性能工業仿真平臺與其他兩家仿真云平臺的硬件參數如下表所示:
計算過程中三個平臺的一些輸出日志如下圖所示:
本次仿真并行規模分別選取了16核、32核、64核、128核(受限于另外兩個平臺無法進行跨節點并行,并行規模無法進一步擴大),我們在“神工坊”平臺進行了256核等更大規模的并行計算,結果顯示計算用時會進一步縮短。
“神工坊”高性能工業仿真平臺與其他幾家仿真云平臺的計算時間如下圖所示,其中,由于仿真云平臺2最高只能64核并行使用,故圖表中無仿真云平臺2并行規模為128核的結果。
可以發現,“神工坊”高性能工業仿真平臺在進行穩態仿真分析時,表現出了絕對的速度優勢。從16核到128核,其仿真計算速度都明顯優于其他仿真云平臺,且在相同并行核數下其仿真計算時間僅為其他仿真云平臺的1/2不到,尤其是在64核并行時,其仿真計算時間更是只有仿真云平臺1的1/3左右。
我們以每個仿真云平臺16核的計算時間為基本單位,計算各個平臺的并行效率,結果如下圖所示。我們可以發現“神工坊”高性能工業仿真平臺的并行效率也是優于其他仿真云平臺,且在每個核數下都保持著較高的并行效率。
結論
綜上所述,“神工坊”高性能工業仿真平臺在進行Fluent穩態仿真分析時,無論是計算時間還是并行效率,均優于其他仿真云平臺。
“神工坊”高性能工業仿真平臺以超算HPC集群作為硬件支撐,實現了跨節點大規模并行計算,可以高效處理大規模網格模型以及復雜流場,大大縮短了企業仿真用時,提升工業設計效率。
十四五期間,工業數字化將是工業轉型升級的主路線。
展開 
64核的相關專題、標簽、搜索
64核的最新內容
核)或 雙路 AMD EPYC 9334(32核×2)
MC/LHS 批量仿真可充分利用多核并發,64 核可同時跑 8-16 個 Job
內存
256GB DDR5-4800 ECC RDIMM(8×32GB)
多 Job 并發時內存需求疊加,256GB 保障不溢出
在實際測試中,使用不同規模的計算資源對同一組LS-DYNA任務進行運算,結果如下:
本地計算資源:
使用32、48、64核計算資源,耗時分別為821、566、439分鐘。
注:本地資源有限,無法提供更多資源測試,共進行了3次作業提交,總計耗時1826分鐘。
在實際測試中,使用不同規模的計算資源對同一組LS-DYNA任務進行運算,結果如下:
本地計算資源:
使用32、48、64核計算資源,耗時分別為821、566、439分鐘。
注:本地資源有限,無法提供更多資源測試,共進行了3次作業提交,總計耗時1826分鐘。
仿真結果
迭代完成之后仿真云圖如下所示:
仿真平臺對比
我們進行Fluent旋轉機械穩態分析時,“神工坊”高性能工業仿真平臺與其他兩家仿真云平臺的硬件參數如下表所示:
計算過程中三個平臺的一些輸出日志如下圖所示:
本次仿真并行規模分別選取了16核、32核、64核、128核(受限于另外兩個平臺無法進行跨節點并行,并行規模無法進一步擴大),我們在SimForge
核CPU AMD EPYC 7H12 64-Core Processor </span></li><li>Windows單機:<span style="background-color: rgba(237, 237, 237, 0.75);"> Windows10系統,12核CPU(8個Performance-core) Intel? Core? i7-13700F <
AI驅動材料預測/深度學習模擬
典型任務:基于實驗數據的強度預測、固化曲線AI建模
組件
推薦配置
GPU
A100 x 2或H100 x 2
CPU
AMD EPYC 9534(64核)
凌炫E3700單屏/E3900三屏移動便攜工作站,科學計算、數值模擬、氣象數據處理、地質勘探、石油天然氣、三維圖形設計、有限元分析、圖形渲染、4K/8K視頻制作、數據可視化、3D動畫、測繪影視制作、是6個月前
處理器: 2顆EPYC 4th處理器9334 32核心64線程,2.7GHz~3.9GHz;
雙路 AMD EPYC 9334,構成 64核128線程 的龐大計算集群。這遠超普通桌面處理器,極其適合需要大量并行計算的任務,
? 科學計算:復雜的數值模擬、有限元分析。
? 數據處理:氣象、地質勘探的大規模數據運算。
“神威·太湖之光”是另一種異構系統,組成它的SW26010芯片采用片上融合的異構眾核架構,如圖2所示,每塊芯片由四個核組組成,每個核組包含一個主核和64個從核。相比于多核架構處理器,異構眾核處理器一般訪存帶寬受限,SW26010在此方面更加顯著,并且非結構網格數據分散,因此非結構網格程序在SW26010眾核處理器上難以獲得較好的性能。
左圖:AMD霄龍CPU,64核128線程, 右圖:英偉達Hopper架構GPU,1.8萬核心
四、我們的探索——UNAP
面對來自“應用與機器”的雙重挑戰,神工坊團隊與國產異構眾核平臺體系架構緊密耦合,發展了一套大型稀疏線性方程組求解庫UNAP。
image_process=/format,webp/quality,q_40" alt="【仿真平臺性能測試】Fluent旋轉機械瞬態分析的圖6"></p><p class="ql-align-justify">本次仿真并行規模分別選取了<strong>16核、32核、64核、128核</strong>,受限另外兩個平臺無法進行跨節點并行,并行規模無法進一步擴大。