
發(fā)布
注冊(cè)
/
登錄HPC集群部署
關(guān)注創(chuàng)建者:匿名 創(chuàng)建時(shí)間:2026-01-04

HPC集群部署的實(shí)例教程
4、Windows HPC的特點(diǎn)
Windows 高性能計(jì)算服務(wù)器,提供了HPC Pack 軟件開發(fā)工具包、作業(yè)調(diào)度系統(tǒng)和管理系統(tǒng)。其最大的特點(diǎn)是與windows server深度融合,可以快速部署HPC。大多數(shù)進(jìn)行數(shù)值模擬的小伙伴,可能不熟悉Linux,只能簡(jiǎn)單操作windows,這種情況下使用微軟HPC能大大降低難度。
部分有限元軟件(如Marc),也提供了客戶端軟件,可以在多臺(tái)計(jì)算機(jī)上并行,但是這個(gè)只是“松散”的耦合,各計(jì)算機(jī)都是基于家用windows,在穩(wěn)定性、安全性上遠(yuǎn)不如windows server,也不如域架構(gòu)下的登錄認(rèn)證方便。另外,大部分有限元軟件,也提供手動(dòng)并行,需要自己安裝MPI,設(shè)置“host”文件(設(shè)置每臺(tái)計(jì)算機(jī)的名稱、核心數(shù)量、工作目錄)和共享的工作目錄,使用起來(lái)非常難用。
5、HPC在數(shù)值模擬中的作用
HPC在本質(zhì)上是屬于“用空間換時(shí)間”,通過(guò)多計(jì)算機(jī)并行來(lái)減少計(jì)算時(shí)間。在數(shù)值模擬過(guò)程中,特別是非線性計(jì)算時(shí),采用單機(jī)計(jì)算時(shí)間可能會(huì)超過(guò)一周,使用多臺(tái)計(jì)算機(jī)就會(huì)縮短計(jì)算時(shí)間。
要充分發(fā)揮HPC的性能,有限元軟件對(duì)HPC(包括GPU)的支持也很重要。目前在各大有限元軟件中Ansys對(duì)微軟HPC的支持最好。
6、微軟HPC部署
先說(shuō)說(shuō)自己的HPC規(guī)劃,共有四臺(tái)計(jì)算機(jī),具體功能分配情況如下:
存儲(chǔ)節(jié)點(diǎn):使用1臺(tái)較舊的計(jì)算機(jī),CPU是i7-8700k,主板是華碩(華碩網(wǎng)卡通常采用Intel芯片組,在server以下無(wú)法正常安裝驅(qū)動(dòng)),使用24盤位存儲(chǔ)機(jī)箱(帶背板),1張LSI 直通卡(二手),1張聯(lián)想擴(kuò)展卡(二手),電源為臺(tái)達(dá) 650W金牌電源。兩塊10T希捷企業(yè)硬盤(全新白盤),在windows server中使用存儲(chǔ)池,鏡像保存數(shù)據(jù),通過(guò)共享服務(wù)提供網(wǎng)絡(luò)存儲(chǔ)。
展開 1. pbs文件
"matlab.pbs" :
matlab.zip
注:
1:任務(wù)名。
2:使用的的節(jié)點(diǎn)和內(nèi)核數(shù)。
3:m文件名,不包含“.m”后綴。
2. m文件
計(jì)算中心提交后臺(tái)計(jì)算,無(wú)法實(shí)時(shí)顯示圖片,涉及到圖片保存的,要在m文件中設(shè)置不顯示并保存圖片。
"your_script.m" :
注:圖示僅為其中一種實(shí)現(xiàn)方法,不唯一。
3. 提交
(1)將pbs文件及用到的所有m文件上傳至計(jì)算中心同一目錄下;
(2)“qsub matlab.pbs”命令提交;
(3)“cat matlab.o1234”查看進(jìn)度及錯(cuò)誤。
上傳文件
使用winscp將mph文件和pbs文件上傳到集群服務(wù)器。
兩文件必須在同一文件夾!
example.mph為comsol的input文件。
comsol.pbs為集群提交腳本模板。
3. 提交任務(wù)
使用ssh工具(本例為putty)登錄到集群,并使用cd,切換到上述文件夾。
使用命令下列命令提交。
qsub comsol.pbs
4. 查看狀態(tài)命令
qstat -a 查看提交狀態(tài)
NDS為節(jié)點(diǎn)數(shù),TSK為總核數(shù),S列為狀態(tài),R為正在運(yùn)行,C為完成或錯(cuò)誤。
tail -f example.log 實(shí)時(shí)查看計(jì)算進(jìn)度
Fluent集群提交教程--HPC(Cluster集群系統(tǒng))
目錄:
1. 所需文件
2. 修改文件
3. 提交計(jì)算
4. 處理user_define_function.c(付費(fèi)查看)
所需文件
fluent.cas
fluent.dat
fluent.jou
fluent腳本文件,可在Fluent圖形界面錄制,或手動(dòng)編寫。
編寫方法參照幫助手冊(cè),或:
http://www.360doc.com/content/17/1024/20/45841895_697806748.shtml
http://forums.caenet.cn/showtopic-532630.aspx
(付費(fèi)視頻):https://www.yqgqt.org.cn/college/video/c11694
fluent.pbs
fluent集群提交腳本,見附件(付費(fèi)查看)
2. 修改文件
將上述文件上傳到集群服務(wù)器,修改fluent.pbs,完整文件見附件,亦可先修改再上傳。
#PBS -N YourJobName 任務(wù)名,自定
#PBS -l nodes=2:ppn=15 使用節(jié)點(diǎn)數(shù)2,每節(jié)點(diǎn)15核,自定
#PBS -q high 使用high隊(duì)列,自定
JOU = "fluent.jou" jou文件名
MODE = "3ddp" 3d:三維單精度,3ddp:三維雙精度,二維類似
3. 提交計(jì)算
若案例需用到自定義函數(shù),先進(jìn)行第4步,再提交。
展開 
HPC集群部署的相關(guān)專題、標(biāo)簽、搜索
HPC集群部署的最新內(nèi)容
最近微軟發(fā)布了windows server2025,界面非常不錯(cuò),看著windows server2019的界面實(shí)在難受,于是乎就下了決心,把現(xiàn)有的windows server2019+ HPC Pack 2019升級(jí)到windows server2025,順便把自己摸索出的經(jīng)驗(yàn)分享一下,希望能幫助有需要的小伙伴。
教程有點(diǎn)長(zhǎng),分為以下幾個(gè)部分:
1、推薦書目
2、什么是HPC?
1. pbs文件
"matlab.pbs" :
matlab.zip
注:
1:任務(wù)名。
2:使用的的節(jié)點(diǎn)和內(nèi)核數(shù)。
3:m文件名,不包含“.m”后綴。
2. m文件
計(jì)算中心提交后臺(tái)計(jì)算,無(wú)法實(shí)時(shí)顯示圖片,涉及到圖片保存的,要在m文件中設(shè)置不顯示并保存圖片。
"your_script.m" :
注:圖示僅為其中一種實(shí)現(xiàn)方法,不唯一。
3.
1. 修改comsol.pbs
用記事本打開comsol.pbs文件,
將comsol-job-name修改為任意任務(wù)名。
將nodes=2:ppn=4修改為需要的節(jié)點(diǎn)數(shù)(nodes)和每節(jié)點(diǎn)任務(wù)數(shù)(ppn),則該任務(wù)共使用nodes*ppn個(gè)邏輯內(nèi)核。
將example.mph修改為你的mph文件名。
其他信息請(qǐng)勿改動(dòng)。
如下圖所示。
2. 上傳文件
使用
Fluent集群提交教程--HPC(Cluster集群系統(tǒng))
目錄:
1. 所需文件
2. 修改文件
3. 提交計(jì)算
4. 處理user_define_function.c(付費(fèi)查看)
所需文件
fluent.cas
fluent.dat
fluent.jou
fluent腳本文件,可在Fluent圖形界面錄制,或手動(dòng)編寫。
編寫方法參照幫助手冊(cè),或: