
發布
注冊
/
登錄云端計算集群部署的案例
集群也超頻--UltraLAB超頻仿真計算集群2020
更快更完美---UltraLAB超頻仿真計算集群2020
目錄
1 UltraLAB超頻仿真計算集群介紹
1.1 傳統仿真計算集群缺陷
1.2 UltraLAB超頻集群產品介紹
1.3 UltraLAB超頻集群種類及特點
2 超頻服務器、高頻服務器產品介紹
2.1 超頻服務器HF390產品介紹
2.2 超頻服務器F400產品介紹
2.3 高頻服務器HF630產品介紹
2.4 主控與存儲服務器N630產品介紹
3 UltraLAB集群硬件方案推薦2020
3.1 CX390超高頻集群配置方案推薦
3.2 CT400超高頻集群配置方案推薦
3.3 CX630高頻集群配置方案推薦
(一)UltraLAB超頻仿真計算集群介紹
西安坤隆計算機科技有限公司自從2009年推出XASUN SC1計算集群,歷經11年的升級換代,不斷的完善、改進、提升,今天我們擁有超頻服務器(HF390、F400)、高頻服務器(HF630)三個系列(后面有詳細介紹)、并行作業調度系統(Parallel Schedule System,簡稱PSS),
針對有限元分析、有限差分法、有限體積法等不同算法、不同規模,提供更精準的算力,以及計算整個環節無瓶頸、高速、高使用率,我們可以提供最快配置方案:
ANSYS仿真計算超頻集群
多物理場耦合(Comsol Multiphysics)仿真計算超頻集群
MatLAB科學計算超頻集群
Abaqus結構仿真計算超頻集群
電磁仿真(HFSs)計算超頻集群
流體仿真(Fluent)計算超頻集群
1.1 傳統仿真計算集群缺陷
傳統服務器計算集群以刀片服務器或雙路xeon機架式服務器為主,這種集群優點,占用空間少,擁有更多cpu核數,但是cpu因為刀片散熱空間小,選用處理器類型都是低頻多核
展開 有限元仿真計算算法特點與計算集群分析
有限元計算算法特點與計算集群分析
典型應用:結構仿真計算、電磁仿真、多物理場耦合等
計算化學:量子化學計算、分子動力模擬…
典型軟件:Abaqus,ANSYS Mechanical,HFSS,Feko…
求解過程
(1)在網格自動剖分環節,單核計算模式,CPU超高頻率,大幅幅縮短計算時間,加速100%以上
(2)在并行求解環節,隱式算法為主計算并行核數有限,通常加速比最大到18核,HF490計算節點具有多核超高頻,將并行計算求解能力,發揮到極致
(3)在密集數據迭代、高io延遲等待過程, 該機器支持高性能低延遲,保證每個環節均衡高效,延遲等待降到最低
(1)網口數據帶寬,延遲最低到1us微秒
(2)硬盤IO,讀寫帶寬1.5GB/s以上,延遲最低17us微秒
(3)CPU響應速度為C0級
此文只能到這結束了,有興趣進一步了解的朋友私信。
展開 Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-1-3
二. 使用步驟 (User Guide)
選項C : 布署Azure CycleCloud-1
在Linux server上執行Moldex3D初始化
我們將使用 PuTTY 聯機工具聯機到 server 進行設定.
0.請安裝 PuTTY. 下載網頁: https://www.putty.org/
1.將布署 Azure CycleCloud 過程中產生的 Private Key 轉成 PuTTY 使用的 Private key 格式
I.執行 PuTTYgen
II.加載布署 Azure CycleCloud 過程中產生的 Private Key, 按下 Load 并選擇 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.pem. 請輸入 PassPhrase (請參照 MDXAzureDeployment.conf 內[DeployAzureCycleCloud] 區塊下的 SSHKeyPassPhrase 字段)
III.請按下 Save private key 將其儲存為 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.ppk
IV.關閉 PuTTYgen
2.使用 PuTTY 聯機至 server
I.打開 PuTTY, 輸入 server 的 IP
II.點選左方 connection " SSH " Auth, 按下 Browse 按鈕選擇 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.ppk, 然后按下 Open 即可聯機
展開 Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-1-4
?LM server/port :請輸入您地端 LM server 的 IP/port
?Specified by:請選擇 Core Per Node
?Core Per Node: 請輸入之前設定 Azure CycleCloud à OpenPBS 的計算節點型號(見下圖)的 Core數
?Working folder path: 留空
輸入完畢按下 OK
2.提交 Job 進行分析
-當 Job 提交后, OpenPBS 會根據 AutoScaling 機制自動建立計算節點 VM, 計算結束后或是 job 隊列已無 job 時將自動刪除計算節點 VM.
-當您不再需要此 OpenPBS 叢集時, 請回到 Azure CycleCloud 頁面, 點擊 Terminate
-當您不再需要 Azure CycleCloud 以及云端叢集時, 可到 Azure Portal 刪除此資源群組 (如: RG_cyclecloud).
展開 
Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-2-3
?LM server/port :請輸入您地端 LM server 的 IP/port
?Specified by:請選擇 Core Per Node
?Core Per Node: 請輸入之前設定 Azure CycleCloud à Slurm 的計算節點型號(見下圖)的 Core數
?Working folder path: 留空
輸入完畢按下 OK
2.提交 Job 進行分析
-當 Job 提交完成, 你可在 Azure CycleCloud 網頁頁面觀察 Slurm 將會自動建立計算節點. 當 Job 計算完畢且無其他 Job 時, Slurm 將會自動刪除計算節點
-在計算節點尚未建好時, Slurm會將Job狀態顯示為Configuring, 如下圖
-當您不再需要此 Slurm 叢集時, 請回到 Azure CycleCloud 頁面, 點擊 Terminate
-當您不再需要 Azure CycleCloud 以及云端叢集時, 可到 Azure Portal 刪除此資源群組 (如: RG_cyclecloud).
展開 Moldex3D遠端計算的Azure-Connect使用步驟之部署Azure CycleCloud-
二. 使用步驟 (User Guide)
選項C : 布署Azure CycleCloud-1
設定Azure CycleCloud
-請將 4. Please open the browser and visit [http://….] 中括號內的文字復制, 并貼到瀏覽器的網址列進行訪問
-會出現https警告, 這是正常的, 請按下進階然后點選繼續前往
-Site name可以使用默認值, 或是自行修改, 然后按下Next
-請勾選 同意, 然后按下 Next
-User ID 請輸入與 MDXAzureDeployment.conf 內 [DeployAzureCycleCloud] 區塊下的 AdminUsername 字段相同的賬號. Name 可以留空不輸入. Password 與 Confirm 請輸入與 MDXAzureDeployment.conf 內 [DeployAzureCycleCloud] 區塊下的 AdminPassword 字段相同的密碼. SSH Public Key 請輸入MDXAzureDeploymentConsole畫面的SSH Public key contents:中括號里面的內容.
-輸入完成的畫面如下. 請按下 Done
-接下來畫面會跳到設定訂閱(Subscription)的部分. Subscription Name 請填任意文字(如: subscription1), 然后按下 Validate Credentials
-按下 Validate Credentials 后, 會顯示 Test succeeded. 接著往下輸入信息.
?Default location 是下拉式選單, 請選擇與
展開 Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-1-2
使用步驟 (User Guide)
選項C : 布署Azure CycleCloud-1
在Azure CycleCloud設定OpenPBS
-請點擊 OpenPBS 的圖案, 之后會出現畫面如下圖, 請輸入Cluster Name (例如: mypbs),
注意: 強烈建議您使用小寫英文字母作為 cluster name, 請不要使用_ (底線underscore)或是- (連字符hyphen), 也請避免在 Cluster name 第一個字母使用數字, 以避免計算叢集建立時出現不可預期的問題.
-然后按下 Next。
-請按下 Execute VM type ( 即計算節點)旁邊的 Choose 按鈕, 進行計算節點型號的選擇。
-挑選VM型別, 請參考選項 E. ListVMSKUs: 列出指定地區的虛擬機(VM)規格 與 選項F. ListVMSKUBySize: 列出指定地區的指定虛擬機(VM)規格
-這邊我們選了 Standard_DS4_v2, 請特別留意他的 Core 數量是8, 這個 Core 數量在后續設定 Computing Manager 時會用到. 請按下 Apply.
注意: 若您看不到任何機器列表, 請先按下右下角的 Cancel 按鈕, 等候約 3 分鐘后再重新設定 OpenPBS.
展開 Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-2-1
使用步驟 (User Guide)
選項C : 布署Azure CycleCloud-2
在Azure CycleCloud設定Slurm
-請點擊 Slurm 的圖案, 之后會出現畫面如下圖, 請輸入 Cluster Name (例如: myslurm),
注意: 強烈建議您使用小寫英文字母作為 cluster name, 請不要使用_ (底線underscore)或是- (連字符hyphen), 也請避免在 Cluster name 第一個字母使用數字, 以避免計算叢集建立時出現不可預期的問題.
-然后按下 Next
-請按下 HPC VM type (即計算節點)旁邊的 Choose 按鈕, 進行計算節點型號的選擇
-這邊我們選了 Standard_D4S_v2, 請特別留意他的 Core 數量是 8, 這個 Core 數量在后續設定 Computing Manager 時會用到. 請按下 Apply.
-注意: 若您看不到任何機器列表, 請先按下右下角的 Cancel 按鈕, 等候約 3 分鐘后再重新設定 Slurm.
-在 Auto-Scaling 的部分, 請使用默認值
-在 Networking 的部分, Subnet ID 請在下拉式選單進行選擇: 請選擇名稱開頭符合與 MDXAzureDeployment.conf 內 [DeployAzureCycleCloud] 區塊下的 ResourceGroupName 字段相同的名稱, 之后為 VNET-ClusterSubnet 的項目
-接著按下 Next.
展開 Moldex3D遠端計算Azure-Connect使用之部署Azure CycleCloud-2-2
二. 使用步驟 (User Guide)
選項C : 布署Azure CycleCloud-2
在Slurm叢集的scheduler上執行Moldex3D初始化
我們將使用 PuTTY 聯機工具聯機到 server 進行設定.
0.請安裝 PuTTY. 下載網頁: https://www.putty.org/
1.將布署 Azure CycleCloud 過程中產生的 Private Key 轉成 PuTTY 使用的 Private key 格式
I.執行 PuTTYgen
II.加載布署 Azure CycleCloud 過程中產生的 Private Key, 按下 Load 并選擇 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.pem. 請輸入 PassPhrase (請參照 MDXAzureDeployment.conf 內[DeployAzureCycleCloud] 區塊下的 SSHKeyPassPhrase 字段)
III.請按下 Save private key 將其儲存為 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.ppk
IV.關閉 PuTTYgen
2.使用 PuTTY 聯機至 server
I.打開 PuTTY, 輸入 server 的 IP
II.點選左方 connection " SSH " Auth, 按下 Browse 按鈕選擇 C:\Moldex3D\Azure-Connect 2023\Config\sshkey\cyclecloudkey.ppk, 然后按下 Open 即可聯機
展開 如何在集群環境中使用fluent計算——fluent并行計算初步(超小白入門,老鳥略過:
現在國內的開放式機群環境越來越多,許多都部署了fluent(大好事),不過還是有許多人不太清楚如何利用這些有用的資源。這里結合我所在單位的情況做一個簡單的介紹,其他的機群環境大同小異。
1、
什么是機群?有什么特點?
機群又叫集群,當然就是許多的計算機(廢話),因為機器太多了,又需要協同工作,所以需要按照一定的方式來管理,管理的結構形式叫做拓撲(這個不用管)。機群使用的電腦是刀片(又薄又長的機箱)形式(為了便于插入機柜),一個刀片一般稱為一個節點。
一般而言,機群會分為三種節點:管理節點(若干臺),編譯節點(若干臺),計算節點(其余全部)。這三種節點的配置略有不同(廢話),管理節點主要用來存儲使用機群的用戶的信息,如名字,密碼,可以使用機器數的權限,用戶狀態等等;編譯節點一般用來預查程序故障,用戶的程序先在這里試運行,查看是否與系統兼容等;計算節點用來直接計算其他節點提供來的程序。
就配置而言,管理節點和編譯節點一般相同,會部署軟件環境;計算節點只會部署簡單的必要運行文件。計算機點之間會采用高速交換機,速度可達幾十GB/s,如IB等;計算節點與編譯、登陸節點之間采用普通的萬兆交換機。
2、
如何使用機群?
機群中一般采用linux操作系統來操作(多用戶情況下效率高),用戶會通過遠程登錄軟件(如xshell)來登錄到登陸節點進行個人的操作(一般會通過VPN網絡加密數據傳輸)。
Linux集群將程序任務分解發送到計算節點上時,是通過LSF作業調度系統(也有其他的,如PBS等)來實現的,這個系統的作用是使整個機群負載均衡,便于管理,所以我們使用fluent也要通過這個系統。在成熟的集群中,用戶登錄之后,默認便可以使用作業調度系統了。
展開 WinXP下并行計算集群的組建
WinXP下并行計算集群的組建1.rar
WinXP下并行計算集群的組建2.rar

云端高性能高性能計算服務
北京市計算中心擁有百萬億次高性能計算能力,長期對外提供Abaqus等多種CAE軟件的高性能計算服務。
采用web服務模式輕松搞定上億網格規模的CAE仿真。
用戶申請:http://www.bcc.ac.cn/cloud/fwsq.html
2023年MATLAB科學計算工作站及集群配置方案
(一)MATLAB科學計算工作站與集群配置方案
UltraLAB專注于為科學計算在各個行業應用的算法,量身定制匹配的高性能計算硬件配置的品牌,提供塔式、機架、便攜、特種等全方位完美計算架構方案。
UltraLAB結合最新計算機硬件技術(intel 13代酷睿超頻/4代Xeon3400x超頻等), 將MATLAB的應用/學科工具箱,進行科學分類,從而給出合理高效完整科學計算硬件配置。
早期我們對MatLAB全部應用工具箱計算特點進行了總結歸類,
詳見 https://www.xasun.com/article/fb/2433.html
今天我們提供多種不同計算架構,保證每一個計算應用對應配置達到理想的最高性能能力,四類硬件配置:
(1)純CPU計算---MatLAB高頻科學計算工作站配置推薦
(2)基于GPU加速---MatLAB 異構超算工作站配置推薦
(3)基于實時計算---MatLAB實時采集與數據計算分析硬件配置方案
(4)基于多機集群---MatLAB多機分布式集群計算配置方案(待續)
1.1 MatLAB高頻科學計算工作站硬件配置推薦
應用定位:滿足極致單核CPU計算或超大規模的多核CPU性能要求
技術特點:基于純CPU計算應用,CPU超頻或高頻,保證單核或多核計算能力達到極致。
展開 電磁仿真計算的最佳單機(工作站、服務器)、集群硬件配置方案
電磁仿真的計算特點如下:
§ 計算量大:電磁仿真通常涉及大量的計算量,這對計算機硬件和軟件提出較高的要求。
§ 精度要求高:電磁仿真需要保證計算結果的精度,這對算法和求解器提出了較高的要求。
§ 模型復雜:電磁仿真模型通常比較復雜,這對軟件的功能和性能提出了較高的要求。
電磁仿真在電子、通信、醫療、天文學等多個領域都有著廣泛的應用,能夠幫助工程師和研究人員優化設計、分析性能和解決電磁問題。
2023年電磁仿真HFSS單機/虛擬加速/集群硬件配置推薦
https://www.xasun.com/article/102/2525.html
CST2023電磁仿真GPU圖形工作站、高性能計算集群推薦硬件
https://www.xasun.com/news/html/?2756.html
上述所有配置,代表最新硬件架構,同時保證是最完美,最快,歡迎交流,定制。
展開 CST2021電磁仿真計算工作站、集群硬件配置探討
(2)是目前市場上,第一個針對電磁仿真多種算法優化設計, 并行計算節點配備高主頻處理器,其性能表現遠超刀片服務器。
(3)【異構并行計算節點】配備最新Xeon3代處理器,40核+16通道是頻域算法電磁仿真并行計算最理想架構,同時保證高頻,整個計算節點的多核并行計算,在核數與頻率達到均衡,此外配備GPU計算卡,保證了時域求解的GPU加速
(4)作業調度軟件針對有限元計算兩個主要環節:網格自動剖分(單核計算環節)、求解器求解(多核計算環節),網格剖分環節--調用【高頻服務器】處理, 求解器求解環節--調用多臺【計算節點】多級多核并行計算
(5)集群性能從硬件架構、作業調度系統均比常規集群性能達到更高效。
展開