設計仿真 | MSC Nastran高性能求解計算(二)

MSC Nastran是一款功能強大的有限元分析(FEA)軟件,是工程仿真的基礎。MSC Nastran已經被結構分析專家使用和驗證了半個世紀,以其穩健性、準確性和能夠解決工程中的挑戰而聞名。

本期摘要內容

? 了解MSC Nastran如何利用高性能計算(HPC)策略提高您的仿真和分析性能。

? 探索適用于所有分析類型(包括靜力學、特征值、動力學和非線性)的可用求解器,以便您可以根據特定的仿真需求選擇最合適的求解器。

? 從其他MSC Nastran用戶和Hexagon專家的經驗中汲取見解,以實現最佳的并行性能,同時最大限度地降低讀取和寫入磁盤的成本。

? 將HPC專業知識與對MSC Nastran求解器的全面了解相結合,以顯著加快仿真速度、最大限度地降低成本并提高不同類型分析的效率。

點擊MSC Nastran高性能求解計算(一),查看首期內容,有關 MSC Nastran 中高性能計算選項的更多詳細信息,請參閱MSC Nastran 2024.1 HPC用戶指南。

01

并行設置  

設計仿真 | MSC Nastran高性能求解計算(二)的圖1

如今,幾乎每臺計算機中的中央處理器(CPU)在物理CPU芯片上都有多個內核。每個物理芯片都稱為一個插槽。根據體系結構的不同,計算機可能配備多個CPU芯片(每個芯片都有自己的插槽),并且每個CPU可能包含多個內核。如果編寫軟件是為了利用多個內核,那么軟件通過并行使用這些內核來提高解決給定問題的速度,稱為可擴展性。  

可擴展性對于求解器來說至關重要,因為它確保了處理規模越來越大、越來越復雜問題的能力,在不影響性能或效率的情況下滿足不斷增長的需求。在MSC Nastran中,有兩種不同但互補的并行處理方式:

?共享內存并行(SMP)

?分布式內存并行(DMP)

兩者之間的區別在圖4中得到了最好的說明。共享內存并行(SMP)系統具有多個處理器共享單個公共內存空間和I/O系統,允許直接通信和數據共享。相比之下,分布式內存并行(DMP)系統為每個處理器分配自己的內存和I/O系統,因此需要顯式消息傳遞才能進行處理器間的通信。SMP架構非常適合多核CPU上的多線程應用程序,而DMP架構在集群等大規模并行計算環境中很常見。

設計仿真 | MSC Nastran高性能求解計算(二)的圖2

圖4:SMP和DMP之間的區別

例如,通常使用SMP和DMP的組合來提高特征值分析問題的求解效率。一般建議將DMP設置為插槽數(如果本機中有多個插槽),并將SMP設置為每個插槽的內核數。如果在具有兩個CPU(插槽)的系統上運行,每個 CPU(插槽)上有10個內核,可以設置dmp=2和smp=10。不同的SMP和DMP組合性能因要解決的具體問題和所使用的模型而異。

02

硬件配置  

設計仿真 | MSC Nastran高性能求解計算(二)的圖3

Part.01

磁 盤

現代操作系統在避免不必要的物理I/O運算方面做得很好,即需要寫入或讀取某些永久存儲設備(如硬盤(HDD 磁性存儲)、固態磁盤(SSD) 或非易失性存儲器(NVMe)的操作。然而,它們執行此操作的能力是有限的,主要由系統中安裝的可用于緩沖I/O(即當前正在運行的進程未占用的內存)內存(RAM)控制。大多數軟件都依賴于操作系統I/O緩沖區來高效工作,但一些軟件(包括 MSC Nastran)實現了自己的緩沖I/O邏輯,盡管這也存在限制。鑒于當前有限元模型的規模,超過系統I/O緩沖大小的問題是很常見的。計算機的I/O系統的速度自然會對性能產生影響,任何可以提高性能的事情都減少計算時間。

Part.02

建議和準則

?避免使用網絡、網絡連接存儲(NAS)或通用串行總線(USB)驅動器。

?SSD(最好是NVMe存儲設備)提供比傳統HDD更高的I/O緩存速率,強烈建議用于存儲臨時數據的文件系統(也就是臨時目錄)。

?如果使用HDD進行臨時文件存儲,磁盤的轉速(范圍為7000至15000 RPM)可能會產生影響;磁盤速度越快,性能越好。

?如果不需要保存數據庫,請使用命令行選項 SCR=YES運行MSC Nastran。使用SCR=YES時,一些臨時數據在使用后會被刪除,而不是移動到數據庫文件中 。

?強烈建議對臨時文件系統(RAID-0)使用設備條帶化??梢栽谠O備上配置多個媒體存儲單元(HDD、SSD 或NVMe),以便同時進行I/O操作,為I/O速度提供了線性縮放。Windows和Linux系統都可以在O/S級別創建RAID-0 條帶化文件系統(不需要特殊控制器)。將設備I/O傳送到內存的管道(稱為前端總線或FSB)對這種縮放施加了限制。其他級別的RAID(例如RAID-5)具有專門構建的冗余,臨時數據不需要冗余,并且可能導致性能下降。

?在Linux 系統上,使用XFS文件系統作為臨時文件系統;臨時數據不需要日志文件系統。

?如果您的預算有限,最好(也更便宜)將4個HDD設備條帶化為RAID-0 而不是單個NVMe。

?注意:所有SSD/NVMe都不相同。選擇臨時存儲時,請檢查設備的讀取和寫入速度。在一次寫入、讀取多個系統時,讀取性能比寫入更重要,但對于MSC Nastran來說,兩者都需要快速才能達到最佳性能。

圖5顯示了MSC Nastran 在兩個作業中比較SSD和HDD(SCSI)介質的性能:

設計仿真 | MSC Nastran高性能求解計算(二)的圖4


圖 5:兩種型號的硬盤驅動器(HDD)與固態驅動器(SSD)磁盤的比較

Part.03

CPUs

很難就哪個處理器是“最佳”的選項給出具體建議,但一些指南可以幫助您做出決定。通常,CPU類型和功能的數量會受到其他硬件選擇的限制,例如主板的架構,它為CPU強加了插槽配置。

在考慮性能時,計算機系統中沒有一個特定的項目可以作為目標——它是一個整體。擁有極快的CPU幾乎沒有意義,如果I/O系統將導致瓶頸并增加運行時間,求解階段將從中受益。同樣,如果CPU速度慢或系統內存不足,則使用極快的I/O系統是沒有意義的。最好以一個能夠很好地協調工作的系統為目標。這通常意味著您不需要最新一代和最強大的CPU,可以選擇已有一兩年歷史的型號。例如,隨著新型號和技術的不斷涌現,被取代的CPU型號的成本在推出后迅速下降,您在這里節省的預算可用于為條帶化I/O系統投資更多內存或更多設備。

在選擇CPU時,尋找比較所有供應商不同處理器之間CPU速度的基準測試網站?;鶞蕼y試的范圍往往很廣,涉及CPU技術的不同方面,因此,如果處理器在執行整數運算方面速度很快,但在浮點運算方面不太擅長,反之亦然,這些特征就會在結果中顯現出來。

隨著當前對環保硬件的推動,CPU芯片通常采用所謂的效率模式(使用E核)或性能模式(使用P核)。雖然這對于運行數據庫應用程序的計算機來說可能非常有用,因為CPU不經常被請求,或者對于一個移動設備電池消耗可能是個問題,但對于插入主電源的計算服務器系統,效率模式會妨礙性能。確保您選擇的CPU能夠禁用效率模式,或者至少強制始終性能模式。

如今,大多數CPU都支持超線程,雖然超線程對于某些傾向于交互式且持續時間較短的應用程序很有用,但在考慮MSC Nastran計算時,經驗表明,禁用超線程會有助于提高性能。您將知道系統上是否啟用了超線程,因為邏輯CPU的數量將使整個CPU插槽的內核數量增加一倍;超線程使CPU看起來擁有比實際更多的內核。

每一代新一代CPU 都帶來了新的邏輯來加速運算,例如通過巧妙地訪問CPU中的寄存器來聚合操作,或者流水線,以便在單個CPU時鐘周期內實現多個運算。過去,我們看到了流式SIMD擴展SSE、SSE2、SSE3、SSE4 和高級矢量擴展AVX(Gesher 新指令)、AVX2(Haswell 新指令)、AVX-512、AVX10 和最近的高級性能擴展APX。

最重要的一點是,MSC Nastran的開發努力支持最新的編譯器和供應商庫,而這些編譯器和供應商庫又支持最新的擴展,因此,一般來說,如果您的系統上有可用的功能,它們將被使用。如果沒有這些功能,也不影響使用。這種兼容性和定期引入新功能是采用最新版本的MSC Nastran軟件的充分理由。

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

1