
發(fā)布
注冊
/
登錄HPC并行計算的案例
Ansys Fluent 提交并行求解作業(yè)到Slurm系統(tǒng)的介紹 | HPC
在 TOP500 排名前 10 的HPC系統(tǒng)中,有超過半數(shù)是使用Slurm來執(zhí)行工作負載管理工作。
目前,Ansys軟件也支持使用Slurm來完成并行求解作業(yè)的任務(wù)提交和管理,本文介紹Ansys Fluent 2023R1版本并行求解作業(yè)提交到Slurm系統(tǒng)的相關(guān)操作。
一. Ansys RSM方式提交
1、首先在Linux集群管理節(jié)點啟動Ansys RSM Launcher服務(wù)。
2、打開Windows端的“RSM Configuration 2023 R1”配置工具,完成Slurm資源的添加配置。
3、打開Windows端的“RSM Cluster Monitoring 2023 R1”工具,可以看到剛配置完成的Slurm隊列的資源狀態(tài):2個計算節(jié)點(node1和node2),每節(jié)點8個CPU Core。
4、在Ansys Workbench中打開Ansys Fluent測試算例,并按圖示1~4步驟的操作說明,完成Fluent作業(yè)的遠程提交。如果項目中有多個待分析任務(wù)的話,建議使用右鍵菜單的Update選項,來準確定位要提交求解的分析任務(wù)。
5、打開“Job Monitor”工具,查看運行中的作業(yè)狀態(tài)。
6、Linux管理節(jié)點上,我們也可以通過squeue命令查看運行中的Slurm作業(yè)的狀態(tài)。
7、計算完成后,計算結(jié)果自動傳回Windows主機上的項目文件目錄,我們在本地完成后處理工作。
展開 CFD網(wǎng)格生成新高度——HPC并行處理大規(guī)模網(wǎng)格
使用并行處理生成網(wǎng)格
為了提高CFD數(shù)值模擬的速度和效率,通常需要并行計算以便充分利用高性能計算機(HPC)的強大并行處理能力。根據(jù)HPC的特點,可以實現(xiàn)為共享存儲,在不同的網(wǎng)格區(qū)域同時運行求解器,及時獲得不同區(qū)域之間的結(jié)果進行信息整合。
高性能計算流體力學
關(guān)鍵技術(shù)主要包含以下幾種:
相鄰的網(wǎng)格單元區(qū)塊各自獨立完成迭代求解,之后將流場信息進行交換。
對大規(guī)模原始網(wǎng)格進行二次剖分,以獲得更多小規(guī)模的網(wǎng)格區(qū)塊進行迭代求解;另外一種情況是對各網(wǎng)格區(qū)塊進行組合,形成少數(shù)目的邏輯組進行求解。
通過增加計算進程的總數(shù)目,從而增大CFD模擬的并發(fā)度,加快網(wǎng)格區(qū)塊之間的通信,在兩者之間取得平衡,達到并行加速的目的。
確定計算任務(wù)的進程,利用高性能系統(tǒng)所提供的任務(wù)工具來實現(xiàn)硬件調(diào)配。
當同一個任務(wù)同時有多條并行,在每個軟件和硬件CPU核間建立固定的映射,已達到最大的性能效益。
工程師利用高性能計算機平臺進行以下測驗。
計算機屬性為單結(jié)點內(nèi)存48GB;主頻2.93GHz;6核CPU。
過程:使用64個對稱并行模擬,考查迭代求解過程中的計算時間。
展開 安裝Moldex3D遠程計算Microsoft HPC模式計算節(jié)點
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節(jié)點 (Compute Node)
?將操作計算機換成計算節(jié)點(compute node)計算機,從Moldex3D安裝文件夾中執(zhí)行setup.exe安裝檔。
?選擇 "I accept the terms of the license agreement" 同意授權(quán)條款,并點 "Next" 進行下一步。
?選擇 "Parallel Computing Settings" 設(shè)定并行計算參數(shù),點 "Next" 進行下一步。
?選 "Cluster (DMP) mode configuration (Compute node)" 叢集(DMP)模式(計算節(jié)點),點 "Next" 進行下一步。
?選 "Browse" 瀏覽和主節(jié)點共享的網(wǎng)絡(luò)驅(qū)動器。
?找到與主節(jié)點共享的網(wǎng)絡(luò)驅(qū)動器里 "Moldex3D_2023" 文件夾,選擇MDX_ParallelSettings.cfg 檔案,點 "Open" 開啟。
?點擊 "Next" 進行下一步。
?點擊 "Install" 開始安裝,并等待安裝完成。
?選擇 "Yes, I want to restart my computer now" 重新啟動計算機,并點 "Finish" 結(jié)束安裝程序。
展開 安裝Moldex3D遠程計算Microsoft HPC模式計算節(jié)點-1
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節(jié)點 (Compute Node)
Moldex3D Job Scheduler (Microsoft HPC Mode)
?將操作計算機換到主節(jié)點計算機。
?打開 Moldex3D Job Scheduler。
?在 "account" 賬號頁面,可以為不同的使用者創(chuàng)建賬戶。
?在 "Job" 工作頁面,所有的工作都會列在這邊。
?在Microsoft HPC模式下,不支持讓使用者調(diào)整工作的排序。
?在 "Diagnostic" 診斷測試頁面,使用者可以建立環(huán)境檢查測試。
?測試內(nèi)容包含
?文件夾權(quán)限檢查
?所需的組件確認
?Moldex3D Job Scheduler 和 Microsoft Job Scheduler 之間的連接確認
?在 "Operation History" 歷史頁面,工作的操作紀錄會列在上面。
?在工作紀錄(Job Record)頁簽中,所有完成/失敗/取消的工作都會列出來。
?在Microsoft HPC模式下,Moldex3D Job Scheduler 沒有 "Node" 節(jié)點頁面。
?如果要管理計算節(jié)點,使用者必須打開Microsoft HPC Cluster Manager。
Microsoft HPC Cluster Manager
?選擇 "Resource Management" 資源管理將節(jié)點狀態(tài)轉(zhuǎn)為上/下線。
?只有 "上線" 的節(jié)點才可以執(zhí)行叢集工作。
展開 
安裝Moldex3D遠程計算Microsoft HPC模式計算節(jié)點-2
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節(jié)點 (Compute Node)
在Moldex3D Job Scheduler 中檢視工作
?使用者可以透過Moldex3D Job Scheduler和Microsoft HPC叢集管理器中檢視工作的狀態(tài)。
在Microsoft HPC叢集管理器中檢視工作
?提交的工作會被送到Microsoft Job Scheduler。
?Moldex3D Job Scheduler會將分析狀態(tài)傳給Microsoft Job Scheduler。
在Microsoft HPC遠程計算模式下移除工作
?注意在此處的 "移除工作 (Remove job)" 只會移除在Moldex3D工作排程器中的工作紀錄,在Microsoft Job Scheduler里的工作紀錄無法被用戶移除。
在Microsoft Job Scheduler中管理工作紀錄
?雖然Microsoft HPC Job Scheduler無法刪除工作,但可以在 "Job Scheduler Configuration" 的 "歷史工作(Job History)" 中管理。
在 Microsoft HPC 遠程計算模式調(diào)整工作順序
?如果使用者嘗試在Moldex3D計算管理器中調(diào)工作排序,會出現(xiàn) "Microsoft HPC工作排程器不支持移動工作(Job movement is not supported in Microsoft Job Scheduler)"。
展開 AMD EPYC 128核心256線程 CPU計算服務(wù)器/GPU服務(wù)器仿真計算、HPC計算、大數(shù)據(jù)分析、
這對于需要處理海量并行任務(wù)的應(yīng)用來說是巨大的優(yōu)勢。
性能定位: EPYC 9554屬于第四代EPYC(代號“Genoa”)處理器,采用先進的Zen 4架構(gòu)和5nm制程,能效比極高。3.1GHz的基礎(chǔ)頻率和3.75GHz的最大加速頻率,保證了單核和多核性能都非常強勁。
適用場景: 完美契合您所列的“數(shù)值計算、大數(shù)據(jù)分析、人工智能、仿真”等高度并行化的計算任務(wù)。
3.
處理器參數(shù): 共 128 核心 256 線程,3.1GHz~3.75GHz;
4.
芯片組: System on Chip
5.
系統(tǒng)內(nèi)存:768GB DDR5-4800 R.ECC
容量分析: 768GB是相當大的內(nèi)存容量,足以容納超大型數(shù)據(jù)集,滿足絕大多數(shù)科學計算、虛擬機集群和內(nèi)存數(shù)據(jù)庫的需求。
技術(shù)優(yōu)勢: 采用最新的DDR5內(nèi)存,帶寬高達4800MT/s,遠超上一代DDR4,能充分發(fā)揮EPYC處理器的多核計算潛力,避免“內(nèi)存墻”瓶頸。RECC(帶寄存器的錯誤校正碼)確保了長時間穩(wěn)定運行和數(shù)據(jù)完整性。
6. 系統(tǒng)盤: 1TB NVMe SSD
6.
存儲盤: 3*16T HDD企業(yè)級
7.
陣列卡: LSI 3108-8I 1G支持RAID0.1.5.10
系統(tǒng)盤: 1TB NVMe SSD。速度快,能確保操作系統(tǒng)和應(yīng)用軟件快速啟動和響應(yīng)。
數(shù)據(jù)盤: 3 x 16TB SATA HDD。提供了48TB的巨大存儲空間,適合存放海量計算結(jié)果、模型數(shù)據(jù)、視頻素材等。
展開 高性能計算(HPC)服務(wù)器加速LSDYNA計算效果展示
分享幾個我司為客戶提供的高性能計算服務(wù)器案例,LSDYNA軟件提速數(shù)倍。
1. 如下圖,客戶采用自有的工作站進行射流沖擊仿真,運行至250微秒用時3天多,我司服務(wù)器運行至250微秒只需3小時,提速24倍+。
2. LSDYNA爆炸仿真,客戶自己電腦用時28小時,我司集群3小時完成,提速8倍。
3. 某高校客戶,爆炸仿真,客戶租用工作站12小時只跑了1000微秒,而我司服務(wù)器跑完6000微秒用時57分鐘,提速72倍+。
4. 某軍工客戶,爆炸仿真,客戶原有電腦需運行155小時,我司工作站僅需5.3小時,提速29倍。
如有需要采購服務(wù)器、建設(shè)高性能計算集群的單位歡迎聯(lián)系。后續(xù)將發(fā)布StarCCM、Fluent、Abaqus等各行業(yè)客戶使用我司服務(wù)器后的性能提升案例。
展開 凌炫LE5039單路 XE5049雙路 EPYC 9754/9654/9554/9354工作站塔式服務(wù)器主機 仿真計算、HPC計算、有限元分析、CFD、ANSYS、CAE。
供應(yīng)商資質(zhì):ISO9001、ISO4001
產(chǎn)品主要應(yīng)用于CAE/CAD/CAM、圖形設(shè)計、影視特效、數(shù)值計算、大數(shù)據(jù)分析、圖像處理、人工智能、人臉識別、仿真、設(shè)計研發(fā)等行業(yè)。客戶涵蓋:高等院校、科研領(lǐng)域、能源、醫(yī)療、航空航天、氣象、軍事、電力、金融、廣電、制造、地質(zhì)物探、建筑設(shè)計、石油化工、人工智能等領(lǐng)域。#深度學習 #服務(wù)器 #計算 #仿真計算服務(wù)器 #高校計算服務(wù)器 #CAE仿真 #CFD仿真計算 #工作站 #建模渲染
2005高性能計算應(yīng)用大會---并行計算
2005高性能計算應(yīng)用大會---并行計算
2005高性能計算應(yīng)用大會---并行計算.part1.rar
2005高性能計算應(yīng)用大會---并行計算.part2.rar
2005高性能計算應(yīng)用大會---并行計算.part3.rar
2005高性能計算應(yīng)用大會---并行計算.part4.rar
2005高性能計算應(yīng)用大會---并行計算.part5.rar
2005高性能計算應(yīng)用大會---并行計算.part6.rar
展開 Altair全球虛擬大會 I 仿真、高性能計算(HPC)和人工智能(AI)...
從電氣化和數(shù)據(jù)驅(qū)動的企業(yè),到人工智能驅(qū)動的仿真和半導體,您將了解仿真、高性能計算(HPC)和人工智能(AI)的融合如何釋放技術(shù)投資的全部潛力。
無論您是想拓寬您對計算科學的了解,還是想深入研究仿真、人工智能、高性能計算或數(shù)據(jù)分析,都能在本次大會中獲得有價值的資訊。
CCF HPC China2023|澎峰科技:使能先進計算,賦能行業(yè)應(yīng)用
作為國家綜合實力的硬指標,超算領(lǐng)域的發(fā)展往往體現(xiàn)的是國家的真實實力和世界地位,隨著CCF HPC China會議每年的推動,超算及其所涉及的包括AI、大數(shù)據(jù)等領(lǐng)域也在每年呈遞增形式高速發(fā)展,推動CCF HPC China大會不只是行業(yè)的需求更是此領(lǐng)域各位科學家、從業(yè)人員對國家發(fā)展的一種貢獻。CCF HPC China每屆會議也不只是行業(yè)的風向標和發(fā)展成就展示的舞臺,更象征著一個國家的繁榮昌盛,和一個領(lǐng)域在國際的所屬位置。相信隨著CCF HPC China的一屆屆的延續(xù),我國超算領(lǐng)域的地位也會再攀新高。

大規(guī)模工程計算解決方案-并行計算編程高級培訓班
中國科學院計算技術(shù)研究所教育中心
隨著CAE技術(shù)的高速發(fā)展,工程計算的規(guī)模逐漸擴大,以致多核計算成為發(fā)展趨勢。目前各研究機構(gòu)多核并行程序開發(fā)不足,隨著多核硬件技術(shù)發(fā)展,在硬件設(shè)備上存在不同程度的利用不足。通過加強并行程序的設(shè)計與開發(fā),研究機構(gòu)可以充分的利用現(xiàn)有設(shè)備資源提高工作效率,降低時間成本,實現(xiàn)更大規(guī)模的計算。中國科學院計算技術(shù)研究所教育中心依托自身強大優(yōu)勢,特舉辦“大規(guī)模工程計算解決方案-并行計算編程”高級培訓班,相關(guān)具體事宜通知如下 :
一、培訓目標:
1、現(xiàn)有硬件資源最大化利用
2、提高并行程序設(shè)計與開發(fā)水平;
3、實際體驗超級計算環(huán)境;
4、提供符合自身特點的工程計算解決方案:
三、課程實操:
學員體驗曙光6000高性能計算機環(huán)境,在改并行機群上編譯、調(diào)試和運行教學例子,并在最多達128個核規(guī)模下測試和分析程序的擴展性和性能。
四、時間地點:2012年11月29日
— 2012年12月02日
北 京(時間安排:第一天報到、授課三天)
課
程
內(nèi)
容
第一章:基本的MPI編程技術(shù)
1.高性能計算概述
2.簡單的MPI程序設(shè)計
3.如何運行MPI程序
上機實操課程
應(yīng)用實例
1.MPICH的安裝、程序編譯與運行。
2.Hello world程序的編寫
3. 循環(huán)消息傳遞程序的編寫。
第二章:高級MPI編程技術(shù)
1.定義新的數(shù)據(jù)類型
2.非阻塞通信
3.各種組通信
上機實操課程
應(yīng)用實例
1.4種產(chǎn)生新數(shù)據(jù)類型的方法
;
2.各種非阻塞的發(fā)送與接收操作
3 最常見的幾種組通信操作。
展開 Altair全球虛擬大會 I 仿真、高性能計算(HPC)和人工智能(AI)...
從電氣化和數(shù)據(jù)驅(qū)動的企業(yè),到人工智能驅(qū)動的仿真和半導體,您將了解仿真、高性能計算(HPC)和人工智能(AI)的融合如何釋放技術(shù)投資的全部潛力。
無論您是想拓寬您對計算科學的了解,還是想深入研究仿真、人工智能、高性能計算或數(shù)據(jù)分析,都能在本次大會中獲得有價值的資訊。
Mathematica 的并行計算
只要您使用其中一個并行命令(例如并行計算表的元素),Mathematica 就會在每個內(nèi)核上啟動一個額外的內(nèi)核并分配工作。為了讓自己相信計算確實發(fā)生在這些額外的內(nèi)核上,我們可以要求一個計算來告訴我們每個元素的計算位置。
每個正在運行的內(nèi)核都有一個唯一的 ID 值,可以幫助調(diào)度更復雜的分布式算法。
本周 (2009/3/18) 發(fā)布的 gridMathematica Server (https://wolfr.am/10mM353BQ) 是邁向無障礙并行計算的又一重要步驟。在早期,人們必須收集網(wǎng)絡(luò)中所有可用機器的主機名,并使用遠程登錄技術(shù)在這些機器上啟動 Mathematica。如今,您網(wǎng)絡(luò)上的 gridMathematica 安裝將自我宣傳,就像您的打印機、多媒體播放器和其他共享資源一樣。
可用的機器將顯示在控制面板中,您只需選擇要使用的機器即可。在這里,我的小網(wǎng)絡(luò)由兩臺雙核機器組成,其中一臺可用。
現(xiàn)在,我總共有六個內(nèi)核可用。
Mathematica 也是分析并行計算性能的最佳工具。在這里,我們測量了兩個遠程內(nèi)核的基本延遲。延遲只是簡單計算的往返時間。
并非所有計算都受益于并行化。例如,內(nèi)核計算 Sin[1.0] 所花費的時間比將這個命令發(fā)送到另一個內(nèi)核并接收結(jié)果所花費的時間要少。
新的并行狀態(tài)窗口使用動態(tài)更新來顯示每次并行計算后的基本性能數(shù)據(jù)。它可以讓您一目了然地看到調(diào)度對不均勻問題的影響。在第一次運行中,我們將一系列素性測試單獨安排到兩個可用的內(nèi)核上。從狀態(tài)窗口的快照可以看出,這兩個內(nèi)核都執(zhí)行了相當一部分工作。
現(xiàn)在我們預先在每個內(nèi)核上安排一半的測試。
展開 一文讀懂Fluent并行計算,三大技術(shù)提升計算效率新境界!
隨著技術(shù)的不斷進步,Ansys工程師們致力于優(yōu)化底層的并行算法,以提升其計算性能,使用戶體驗飛一般的計算速度。
在Ansys Fluent中,盡管工程師已經(jīng)針對并行算法進行了充分優(yōu)化,但在實際應(yīng)用中,還有其他方法可以進一步提高計算性能。本文闡述了Fluent并行計算的基本原理,同時探討通過AVX2指令集加速、GPU加速以及超線程等技術(shù)手段來提高計算效率。
01 什么是Fluent并行計算
Fluent的并行求解器通過協(xié)同運作多個進程來計算大型問題,這些進程既可以在同一臺機器上運行,也可以在網(wǎng)絡(luò)中的不同設(shè)備上運行。
并行求解器將計算域分為多個區(qū)域(圖1),將各數(shù)據(jù)分區(qū)分配至不同的計算進程(稱為計算節(jié)點,圖2),每個計算節(jié)點都在其專屬數(shù)據(jù)集上同步執(zhí)行同一程序。主進程(或稱為主機)不包含網(wǎng)格單元、面或節(jié)點(除非使用 DPM 共享內(nèi)存模型),其主要職責是解析 Cortex(負責用戶界面和圖形相關(guān)功能的 Fluent 進程)發(fā)送的指令,并將這些指令(及數(shù)據(jù))傳遞給某一計算進程,再由該計算進程將其分發(fā)至其他計算進程。
圖1:計算區(qū)域分區(qū)
圖2:分區(qū)網(wǎng)格邊界
計算節(jié)點負責存儲并執(zhí)行部分網(wǎng)格的計算任務(wù),而位于分區(qū)邊界的單層重疊單元格層則負責跨分區(qū)邊界的通信(圖2)。盡管單元格和面被分割,但網(wǎng)格中的所有域和線程在每個計算節(jié)點上均存在鏡像(圖3)。線程以鏈接列表的形式存儲,和串行求解器保持一致。計算節(jié)點可在大規(guī)模并行計算機、多CPU 工作站或具備相同或多工作站組成的網(wǎng)絡(luò) 上實現(xiàn)。 [1]
圖3:分布式網(wǎng)格中的域和線程鏡像
命令傳輸和通信
在Flunet并行計算會話中,進程涉及的主體包括 Cortex(主機進程)和一組 n 個計算節(jié)點進程,這些計算節(jié)點由 0 到 n-1 進行標記(圖4)。
展開