
發布
注冊
/
登錄遠程計算的案例
安裝Moldex3D遠程計算Microsoft HPC模式計算節點-2
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節點 (Compute Node)
在Moldex3D Job Scheduler 中檢視工作
?使用者可以透過Moldex3D Job Scheduler和Microsoft HPC叢集管理器中檢視工作的狀態。
在Microsoft HPC叢集管理器中檢視工作
?提交的工作會被送到Microsoft Job Scheduler。
?Moldex3D Job Scheduler會將分析狀態傳給Microsoft Job Scheduler。
在Microsoft HPC遠程計算模式下移除工作
?注意在此處的 "移除工作 (Remove job)" 只會移除在Moldex3D工作排程器中的工作紀錄,在Microsoft Job Scheduler里的工作紀錄無法被用戶移除。
在Microsoft Job Scheduler中管理工作紀錄
?雖然Microsoft HPC Job Scheduler無法刪除工作,但可以在 "Job Scheduler Configuration" 的 "歷史工作(Job History)" 中管理。
在 Microsoft HPC 遠程計算模式調整工作順序
?如果使用者嘗試在Moldex3D計算管理器中調工作排序,會出現 "Microsoft HPC工作排程器不支持移動工作(Job movement is not supported in Microsoft Job Scheduler)"。
展開 透過Moldex3D RC 安裝程序修改Windows設定遠程計算文件夾權限配置
?Moldex3D遠程計算 (Remote Computing) 的Windows防火墻設定:客戶端(Client Node)
Windows防火墻例外清單已經在Moldex3D安裝程序中自動設定。詳細內容如下:
添加到例外清單的遠程計算(Remote Computing)組件:
C:\Moldex3D\2023\Bin\MDXComputingManager2023.exe
透過Moldex3D RC 安裝程序修改Windows設定遠程計算的Windows Defender
透過Moldex3D RC 安裝程序修改Windows設定
? Moldex3D遠程計算的Windows Defender設定 (Windows Defender Configuration of Moldex3D Remote Computing)
?Moldex3D遠程計算(Remote Computing)的Windows defender設定:主節點(Master Node)、叢集模式(DMP)和MSHPC模式
Window Defender排除項目列表已經在Moldex3D安裝程序中自動設定。詳細內容如下:
添加到排除項目列表的并行計算(Parallel Computing)組件文件夾:
C:\Program Files\Intel MPI 2019\x64
C:\Moldex3D\2023\Bin
\\MasterNodeIP\Moldex3D_2023\Bin
* 請根據使用者自己的設定修改MasterNodeIP。MasterNodeIP可以為地址或主機名。
?Moldex3D遠程計算(Remote Computing) 的 Windows defender 設定:主節點 (Master Node)、單節點 (Single Node) 模式
Window Defender排除項目列表已經在Moldex3D安裝程序中自動設定。
展開 安裝Moldex3D遠程計算Microsoft HPC模式計算節點
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節點 (Compute Node)
?將操作計算機換成計算節點(compute node)計算機,從Moldex3D安裝文件夾中執行setup.exe安裝檔。
?選擇 "I accept the terms of the license agreement" 同意授權條款,并點 "Next" 進行下一步。
?選擇 "Parallel Computing Settings" 設定并行計算參數,點 "Next" 進行下一步。
?選 "Cluster (DMP) mode configuration (Compute node)" 叢集(DMP)模式(計算節點),點 "Next" 進行下一步。
?選 "Browse" 瀏覽和主節點共享的網絡驅動器。
?找到與主節點共享的網絡驅動器里 "Moldex3D_2023" 文件夾,選擇MDX_ParallelSettings.cfg 檔案,點 "Open" 開啟。
?點擊 "Next" 進行下一步。
?點擊 "Install" 開始安裝,并等待安裝完成。
?選擇 "Yes, I want to restart my computer now" 重新啟動計算機,并點 "Finish" 結束安裝程序。
展開 
安裝Moldex3D遠程計算Microsoft HPC模式計算節點-1
? 安裝Moldex3D遠程計算Microsoft HPC模式
計算節點 (Compute Node)
Moldex3D Job Scheduler (Microsoft HPC Mode)
?將操作計算機換到主節點計算機。
?打開 Moldex3D Job Scheduler。
?在 "account" 賬號頁面,可以為不同的使用者創建賬戶。
?在 "Job" 工作頁面,所有的工作都會列在這邊。
?在Microsoft HPC模式下,不支持讓使用者調整工作的排序。
?在 "Diagnostic" 診斷測試頁面,使用者可以建立環境檢查測試。
?測試內容包含
?文件夾權限檢查
?所需的組件確認
?Moldex3D Job Scheduler 和 Microsoft Job Scheduler 之間的連接確認
?在 "Operation History" 歷史頁面,工作的操作紀錄會列在上面。
?在工作紀錄(Job Record)頁簽中,所有完成/失敗/取消的工作都會列出來。
?在Microsoft HPC模式下,Moldex3D Job Scheduler 沒有 "Node" 節點頁面。
?如果要管理計算節點,使用者必須打開Microsoft HPC Cluster Manager。
Microsoft HPC Cluster Manager
?選擇 "Resource Management" 資源管理將節點狀態轉為上/下線。
?只有 "上線" 的節點才可以執行叢集工作。
展開 Moldex3D遠端計算的計算管理器簡介之提交工作
•計算主機列表:可添加新的計算主機或修改計算主機的登入數據。
•批作業建立列表:批作業建立列表顯示可提交的工作信息,可上傳至遠程計算,或對現在列表進行提交、移動、移除等操作。
遠程計算主機列表
從列表中選擇一個遠程計算主機IP并點擊聯機 (Connect) 即可鏈接至該主機進行工作。如需管理遠程計算主機列表,點擊新增 (Add)、編輯 (Edit)、移除 (Remove) 來讓使用者加入、修改或者刪除計算主機。
?添加新的遠程計算主機
如果使用者想要添加一個新的遠程計算主機登入信息,僅需點擊新增 (Add),并輸入遠程計算主機的登入信息,按下確定鍵即可成功添加入列表中。
?編輯遠程計算主機登入信息
用戶如果想要編輯遠程計算主機登入信息,僅需在列表上選擇一遠程計算主機IP點擊編輯 (Edit),并輸入遠程計算主機的登入信息,按下確定鍵即可成功修改此遠程計算主機登入信息。
?移除遠程計算主機登入信息
在列表上選擇一遠程計算主機IP點擊刪除(Remove)鍵,會跳出再確認窗口,按下確定(Yes)鍵即可成功移除此遠程計算主機紀錄。
?聯機至任一遠程計算主機以讓用戶提交工作
選擇一遠程計算主機IP并點擊聯機(Connect)鍵,使用者即可提交工作至此遠程計算主機。
新增批作業
按下增加 (Add) 新工作選擇想要匯入工作的批處理文件,此工作信息會自動加入當前批處理列表中。
注:使用者可以利用拖曳來將Moldex3D項目加入批處理列表。
展開 Moldex3D高效能運算之遠端計算 (Remote Computing)前言
? 遠程計算 (Remote Computing)
遠程計算 (RC) 是由計算管理器 (Computing Manager) 和工作排程器 (Job Scheduler) 所組合而成,遠程計算協助使用者及管理者調度和執行工作分析。下面各節將詳細介紹遠程計算各模塊,并在附錄上說明每個按鍵功能。 基于在并行計算小節中以提到關于非服務器版本Windows的連入聯機數量限制的因素,強烈建議使用這在遠程計算的主節點上安裝服務器版本的Windows。
遠程計算架構
在遠程計算的架構中,我們定義了三個角色,即:客戶端、主節點、計算節點。
Moldex3D 2023 工作排程器會在主節點打開兩個靜態通訊端口并等待連接。10190埠用來讓客戶端的計算管理器發送命令,10119埠除了讓計算節點的求解器發送結果之外也用來讓主節點的工作排程器發送命令。當計算管理器開始進行上傳/下載作業時,會透過22埠與主節點的OpenSSH server通訊。
在Moldex3D的計算管理器跟工作排程器之間所有的交流都是加密的。對于計算節點來說,10019埠的作用是和工作排程器交流。工作排程器會透過此通訊端口取得每個計算節點的數據。
布局1:三個角色分別位于不同臺計算機
布局2:主節點和計算節點位于同一臺計算機
布局3:所有角色位于同臺計算機上
Moldex3D提供3種遠程計算模式
?叢集(DMP)模式
叢集(DMP)模式的適用于一或多個客戶端、一個主節點和多個計算節點的環境。
?在此模式下,必須設定一個共享的文件夾與網絡聯機。
?此外,在進行并行計算時需要有憑證(賬號),使用者可以使用現有的賬號或新創一個賬號。
叢集(DMP)模式建議的的配置如同布局1。
展開 Moldex3D模流分析之High Performance Computing of Moldex3D
計算管理器 (Computing Manager)
計算管理器用于調度不同項目進行計算。透過計算管理器將項目分析要求上傳遠程計算,使用者可在計算管理器上檢查分析進度。當計算完畢,可藉由計算管理器手動或自動下載取得計算結果。計算管理器、批處理工作管理與遠程計算服務IP列表將會在下面進行詳細介紹。計算管理器分為六個主要功能:
?提交工作:上傳想要進行分析的項目至遠程計算
?監控工作:監看所有已提交工作的進度
?歷史紀錄:用戶在計算管理器內操作的歷史紀錄
?選項設定:調整計算管理器的細部設定
?紀錄:此處紀錄一些重要的操作訊息。
?關閉:用來關閉計算管理器。
在計算管理器建立遠程工作
下面是透過Moldex3D提交工作至遠程計算主機的步驟說明:
第一步:啟動計算管理器,并點擊新增按鍵添加新的遠程計算主機。
第二步:選取目標主機IP,并點擊聯機。
第三步:匯入項目至Moldex3D Studio后,請點擊”計算管理員”。
-項目會被加入批作業建立清單, 請自行在計算管理員內調整工作數
第四步:在計算管理員中,設定好需要的計算工作數。
第五步:點擊提交來送出計算工作。
第六步:項目會被上傳至計算管理器選擇的計算主機,并且切換至工作監控(Monitoring)頁簽顯示分析的進度。
第七步:當工作狀態顯示為完成,用戶可選擇相關工作并點擊下載 (Download) 鍵,計算結果即會從遠程計算主機上下載回此臺計算機。
展開 Moldex3D遠端計算之計算管理器簡介
計算管理器簡介 (Introduction to Computing Manager)
計算管理器用于調度不同項目進行計算。透過計算管理器將項目分析要求上傳遠程計算,使用者可在計算管理器上檢查分析進度。當計算完畢,可藉由計算管理器手動或自動下載取得計算結果。計算管理器、批處理工作管理與遠程計算服務IP列表將會在下面進行詳細介紹。計算管理器分為六個主要功能:
?提交工作:上傳想要進行分析的項目至遠程計算
?監控工作:監看所有已提交工作的進度
?歷史紀錄:用戶在計算管理器內操作的歷史紀錄
?選項設定:調整計算管理器的細部設定
?紀錄:此處紀錄一些重要的操作訊息。
?關閉:用來關閉計算管理器。
在計算管理器建立遠程工作
下面是透過Moldex3D提交工作至遠程計算主機的步驟說明:
第一步:啟動計算管理器,并點擊新增按鍵添加新的遠程計算主機。
第二步:選取目標主機IP,并點擊聯機。
第三步:匯入項目至Moldex3D Studio后,請點擊”計算管理員”。
-項目會被加入批作業建立清單, 請自行在計算管理員內調整工作數
第四步:在計算管理員中,設定好需要的計算工作數。
第五步:點擊提交來送出計算工作。
第六步:項目會被上傳至計算管理器選擇的計算主機,并且切換至工作監控(Monitoring)頁簽顯示分析的進度。
第七步:當工作狀態顯示為完成,用戶可選擇相關工作并點擊下載 (Download) 鍵,計算結果即會從遠程計算主機上下載回此臺計算機。另外,點擊停止下載 (Stop Download) 可以取消下在的動作而點擊關閉 (Close) 則會關閉計算管理器。
展開 Moldex3D模流分析之iSLM遠端計算
以下將介紹如何安裝iSLM 遠程代理服務:
iSLM Setup Wizard - 版權宣告
iSLM Setup Wizard – 選擇所需模塊
iSLM Setup Wizard – 環境設定
iSLM Setup Wizard - 安裝清單: 安裝
iSLM Setup Wizard - 安裝清單: 結束
Moldex3D Remote Client Agent
系統設定 > iSLM設定 > 遠程計算
在系統設定 > iSLM設定 > 遠程計算的項目:
1.遠程 RC 服務器 :
此顯示 遠程RC服務器 的IP 位置,主要用途為 分析 Moldex3D項目。點擊開關按鈕用以 開啟 或 關閉 遠程RC服務器。若按鈕為藍色,則遠程RC服務器狀態為開啟;若為灰色,則狀態為關閉。
2.項目代理 :
此顯示主要用途為 生長網格、建立項目、建立分析 及 上傳至 RC 服務器 的主機 IP 位置 。點擊開關按鈕用以 開啟 或 關閉 該主機。若按鈕顯示為藍色,則項目代理主機狀態為開啟;若為灰色,則項目代理主機狀態為關閉。
3.遠程計算主機 :
此為 遠程 RC 服務器 及 項目代理 兩者的結合,用戶可透過該主機分析 Moldex3D 項目,也可生長網格、建立項目、建立分析等。需注意的是,若有兩個(含)以上的主機選項,用戶僅能擇一;此外若選擇開啟此主機,則上述之 遠程 RC 服務器 及 項目代理 即使選擇了也會無作用。
注意: 請用戶務必安裝 ”遠程計算主機 ”。
展開 Moldex3D模流分析SYNC之安裝及簡介
?遠程計算(Remote Computing): 透過遠程計算,您可以提交分析工作給管理高效能計算器的服務器。 遠程計算(RC)是一套模塊,包括計算管理器、遠程計算賬戶管理器、工作服務和工作排程器。這些程序幫助用戶和管理者管理和執行作業
c) 獲得分析結果 (Acquire Analysis Results)
Moldex3D 提供完整的分析結果,包括各種變量分布、進階3D顯示的 XY 圖 ,以及可以將報告輸出為 HTML、PPT 和 PDF 檔的自動報告生成器。使用這些分析工具,使用者可以立即了解分析結果,并使用它們來驗證和優化產品設計。
展開 
Moldex3D遠端計算的常見問題之一
這就是為什么顯示“現有連接被遠程主機強制關閉” 訊息的原因。
?“Process X exited without call finalize”表示它已掛機,因為每個求解器進程在退出之前都必須叫出 “MPI_Finalize”。
?接下來,我們的工程師可以怎么做呢?
1.執行 "Diagnostics" 診斷測試
2.使用同一組的計算資源來執行范例測試
-同一組的計算資源,意味著:
o使用相同的計算節點
o每個計算節點使用相同的核心數
如果以上兩個步驟的結果顯示為 ” no error” 沒有錯誤,請聯系求解器團隊來做更進一步地調查。
耗盡所有的端點( Exhausted all end points )
?系統的網絡資源耗盡
?接下來,我們的工程師可以怎么做呢?
-從叢集的所有節點中,卸除/禁用防病毒軟件,然后再次執行分析。
o建議卸除。
-請檢查是否安裝了 “Moldex3D 遠程計算 R11”。 如果是,請將其卸除。
o遠程計算自R12以來是一個全新的架構。
o遠程計算R11有缺陷(它并不是我方開發),我們的許多客戶也都遭受系統資源耗盡的問題。
使用者登入失敗,錯誤1326
?使用“以使用者身份執行”帳戶登入系統失敗。 “錯誤 1326” 是由未知的帳戶或錯誤的密碼所導致的。
?接下來,我們的工程師可以怎么做呢?
-進入主節點,打開 Moldex3D 工作排程器的服務配置。
-修改帳戶/密碼
-執行” diagnostic”診斷測試 ? 如果成功,請再次執行分析。
憑證被拒絕 (Credential is rejected)
?當憑證用于登入計算節點時,一個或多個計算節點拒絕該憑證。
展開 Moldex3D遠端計算的計算管理器簡介之工作監控1
使用者可以在工作監控頁面上確認上傳項目的基本訊息與當前狀態,此頁面還提供取消/重新排序,移除與調整排序功能讓用戶可以遠程操作工作。也可透過下載功能取得分析完畢的結果,自動下載可在選項(Option)接口上設定。
• 顯示所有監控的工作
監控列表可以同時顯示在每臺計算主機上聯機賬號所屬的所有監控工作信息。
• 顯示監控工作的模塊信息
監控列表以樹枝狀呈現,使用者可以任意展開一監控工作觀看模塊信息及其狀態。
• 取消已在隊列的工作
點選已在隊列的工作然后按下取消 (Cancel) 鍵,可以停止指定的工作。計算管理接口將會發送取消訊息至工作所在的遠程計算主機取消工作隊列。工作狀態也會顯示為取消。
• 取消執行中的工作
選擇一執行中的工作,按下取消(Cancel)鍵,將會停止分析并將狀態改成取消。
• 移除在隊列中已取消(Canceled)的工作
選擇一已取消的隊列中工作,按下刪除 (Remove),將會刪除該項工作。按下刪除 (Remove) 后,在跳出的確認對話框點擊確認 (Yes),計算管理接口將會發送刪除訊息至工作所在的遠程計算主機刪除工作,工作也會從監控列表中移除。
• 重新提交取消的工作
選擇一狀態為取消的工作,按下重新排序 (Requeue) 鍵,此工作就可重新加入遠程計算主機的分析隊列中,工作狀態也會同步更新。
展開 Moldex3D遠端計算的計算管理器簡介之工作監控2
? 下載分析完畢的工作
在工作分析完畢后,使用者可利用下載 (Download) 鍵將計算完畢的工作從遠程計算主機下載回來。監控列表可顯示正在下載工作的下載進度。
下載可分成兩種模式,即默認為只下載精簡檔案 (Download compact only) 和下載全部檔案 (Download all files)。使用者可從下拉式選單中選擇其中一種模式下載。若要下載的結果檔案移除暫存盤(temporary file),但包含交換數據 (exchange data)及多段時間 (intermediate time output) 檔,請點選下載精簡檔案 (Download compact only)。若要下載完整的結果檔案,請點選下載全部檔案 (Download all file)選項。
? 取消隊列模塊分析
用戶可展開監控工作的模塊信息,選擇一已在隊列的模塊按下取消 (Cancel) 鍵,即可將其從隊列中移除。計算管理接口將會發送取消訊息至工作所在的遠程計算主機取消工作的此模塊排序。模塊狀態也會顯示為取消狀態。
? 取消監控中工作的任一執行中的模塊分析
計算管理員將會發送取消訊息至工作所在的遠程計算主機停止并取消工作的此模塊排序。模塊狀態也會顯示為取消 (Canceled) 狀態。
? 開始分析工作中取消的模塊
選擇工作中取消的模塊,按下重新隊列 (Requeue) 鍵,取消的模塊可重新加入工作的隊列中。模塊狀態也會同步更新。
? 顯示工作詳細信息窗口
雙擊執行中的工作即可叫起工作的詳細信息窗口。詳細信息窗口可顯示完整的分析過程信息。
展開 Moldex3D模流分析之工作監測
o工作監控 (Monitoring)
使用者可以在工作監控頁面上確認上傳項目的基本訊息與當前狀態,此頁面還提供取消/重新排序,移除與調整排序功能讓用戶可以遠程操作工作。也可透過下載功能取得分析完畢的結果,自動下載可在選項(Option)接口上設定。
? 顯示所有監控的工作
監控列表可以同時顯示在每臺計算主機上聯機賬號所屬的所有監控工作信息。
? 顯示監控工作的模塊信息
監控列表以樹枝狀呈現,使用者可以任意展開一監控工作觀看模塊信息及其狀態。
? 取消已在隊列的工作
點選已在隊列的工作然后按下取消 (Cancel) 鍵,可以停止指定的工作。計算管理接口將會發送取消訊息至工作所在的遠程計算主機取消工作隊列。工作狀態也會顯示為取消。
? 取消執行中的工作
選擇一執行中的工作,按下取消(Cancel)鍵,將會停止分析并將狀態改成取消。
? 移除在隊列中已取消(Canceled)的工作
選擇一已取消的隊列中工作,按下刪除 (Remove),將會刪除該項工作。按下刪除 (Remove) 后,在跳出的確認對話框點擊確認 (Yes),計算管理接口將會發送刪除訊息至工作所在的遠程計算主機刪除工作,工作也會從監控列表中移除。
展開