設計仿真 | MSC Nastran高性能求解計算(二)
MSC Nastran是一款功能強大的有限元分析(FEA)軟件,是工程仿真的基礎。MSC Nastran已經(jīng)被結構分析專家使用和驗證了半個世紀,以其穩(wěn)健性、準確性和能夠解決工程中的挑戰(zhàn)而聞名。
本期摘要內(nèi)容
? 了解MSC Nastran如何利用高性能計算(HPC)策略提高您的仿真和分析性能。
? 探索適用于所有分析類型(包括靜力學、特征值、動力學和非線性)的可用求解器,以便您可以根據(jù)特定的仿真需求選擇最合適的求解器。
? 從其他MSC Nastran用戶和Hexagon專家的經(jīng)驗中汲取見解,以實現(xiàn)最佳的并行性能,同時最大限度地降低讀取和寫入磁盤的成本。
? 將HPC專業(yè)知識與對MSC Nastran求解器的全面了解相結合,以顯著加快仿真速度、最大限度地降低成本并提高不同類型分析的效率。
點擊MSC Nastran高性能求解計算(一),查看首期內(nèi)容,有關 MSC Nastran 中高性能計算選項的更多詳細信息,請參閱MSC Nastran 2024.1 HPC用戶指南。
01
并行設置
如今,幾乎每臺計算機中的中央處理器(CPU)在物理CPU芯片上都有多個內(nèi)核。每個物理芯片都稱為一個插槽。根據(jù)體系結構的不同,計算機可能配備多個CPU芯片(每個芯片都有自己的插槽),并且每個CPU可能包含多個內(nèi)核。如果編寫軟件是為了利用多個內(nèi)核,那么軟件通過并行使用這些內(nèi)核來提高解決給定問題的速度,稱為可擴展性。
可擴展性對于求解器來說至關重要,因為它確保了處理規(guī)模越來越大、越來越復雜問題的能力,在不影響性能或效率的情況下滿足不斷增長的需求。在MSC Nastran中,有兩種不同但互補的并行處理方式:
?共享內(nèi)存并行(SMP)
?分布式內(nèi)存并行(DMP)
兩者之間的區(qū)別在圖4中得到了最好的說明。共享內(nèi)存并行(SMP)系統(tǒng)具有多個處理器共享單個公共內(nèi)存空間和I/O系統(tǒng),允許直接通信和數(shù)據(jù)共享。相比之下,分布式內(nèi)存并行(DMP)系統(tǒng)為每個處理器分配自己的內(nèi)存和I/O系統(tǒng),因此需要顯式消息傳遞才能進行處理器間的通信。SMP架構非常適合多核CPU上的多線程應用程序,而DMP架構在集群等大規(guī)模并行計算環(huán)境中很常見。
圖4:SMP和DMP之間的區(qū)別
例如,通常使用SMP和DMP的組合來提高特征值分析問題的求解效率。一般建議將DMP設置為插槽數(shù)(如果本機中有多個插槽),并將SMP設置為每個插槽的內(nèi)核數(shù)。如果在具有兩個CPU(插槽)的系統(tǒng)上運行,每個 CPU(插槽)上有10個內(nèi)核,可以設置dmp=2和smp=10。不同的SMP和DMP組合性能因要解決的具體問題和所使用的模型而異。
02
硬件配置
Part.01
磁 盤
現(xiàn)代操作系統(tǒng)在避免不必要的物理I/O運算方面做得很好,即需要寫入或讀取某些永久存儲設備(如硬盤(HDD 磁性存儲)、固態(tài)磁盤(SSD) 或非易失性存儲器(NVMe)的操作。然而,它們執(zhí)行此操作的能力是有限的,主要由系統(tǒng)中安裝的可用于緩沖I/O(即當前正在運行的進程未占用的內(nèi)存)內(nèi)存(RAM)控制。大多數(shù)軟件都依賴于操作系統(tǒng)I/O緩沖區(qū)來高效工作,但一些軟件(包括 MSC Nastran)實現(xiàn)了自己的緩沖I/O邏輯,盡管這也存在限制。鑒于當前有限元模型的規(guī)模,超過系統(tǒng)I/O緩沖大小的問題是很常見的。計算機的I/O系統(tǒng)的速度自然會對性能產(chǎn)生影響,任何可以提高性能的事情都減少計算時間。
Part.02
建議和準則
?避免使用網(wǎng)絡、網(wǎng)絡連接存儲(NAS)或通用串行總線(USB)驅(qū)動器。
?SSD(最好是NVMe存儲設備)提供比傳統(tǒng)HDD更高的I/O緩存速率,強烈建議用于存儲臨時數(shù)據(jù)的文件系統(tǒng)(也就是臨時目錄)。
?如果使用HDD進行臨時文件存儲,磁盤的轉(zhuǎn)速(范圍為7000至15000 RPM)可能會產(chǎn)生影響;磁盤速度越快,性能越好。
?如果不需要保存數(shù)據(jù)庫,請使用命令行選項 SCR=YES運行MSC Nastran。使用SCR=YES時,一些臨時數(shù)據(jù)在使用后會被刪除,而不是移動到數(shù)據(jù)庫文件中 。
?強烈建議對臨時文件系統(tǒng)(RAID-0)使用設備條帶化??梢栽谠O備上配置多個媒體存儲單元(HDD、SSD 或NVMe),以便同時進行I/O操作,為I/O速度提供了線性縮放。Windows和Linux系統(tǒng)都可以在O/S級別創(chuàng)建RAID-0 條帶化文件系統(tǒng)(不需要特殊控制器)。將設備I/O傳送到內(nèi)存的管道(稱為前端總線或FSB)對這種縮放施加了限制。其他級別的RAID(例如RAID-5)具有專門構建的冗余,臨時數(shù)據(jù)不需要冗余,并且可能導致性能下降。
?在Linux 系統(tǒng)上,使用XFS文件系統(tǒng)作為臨時文件系統(tǒng);臨時數(shù)據(jù)不需要日志文件系統(tǒng)。
?如果您的預算有限,最好(也更便宜)將4個HDD設備條帶化為RAID-0 而不是單個NVMe。
?注意:所有SSD/NVMe都不相同。選擇臨時存儲時,請檢查設備的讀取和寫入速度。在一次寫入、讀取多個系統(tǒng)時,讀取性能比寫入更重要,但對于MSC Nastran來說,兩者都需要快速才能達到最佳性能。
圖5顯示了MSC Nastran 在兩個作業(yè)中比較SSD和HDD(SCSI)介質(zhì)的性能:
圖 5:兩種型號的硬盤驅(qū)動器(HDD)與固態(tài)驅(qū)動器(SSD)磁盤的比較
Part.03
CPUs
很難就哪個處理器是“最佳”的選項給出具體建議,但一些指南可以幫助您做出決定。通常,CPU類型和功能的數(shù)量會受到其他硬件選擇的限制,例如主板的架構,它為CPU強加了插槽配置。
在考慮性能時,計算機系統(tǒng)中沒有一個特定的項目可以作為目標——它是一個整體。擁有極快的CPU幾乎沒有意義,如果I/O系統(tǒng)將導致瓶頸并增加運行時間,求解階段將從中受益。同樣,如果CPU速度慢或系統(tǒng)內(nèi)存不足,則使用極快的I/O系統(tǒng)是沒有意義的。最好以一個能夠很好地協(xié)調(diào)工作的系統(tǒng)為目標。這通常意味著您不需要最新一代和最強大的CPU,可以選擇已有一兩年歷史的型號。例如,隨著新型號和技術的不斷涌現(xiàn),被取代的CPU型號的成本在推出后迅速下降,您在這里節(jié)省的預算可用于為條帶化I/O系統(tǒng)投資更多內(nèi)存或更多設備。
在選擇CPU時,尋找比較所有供應商不同處理器之間CPU速度的基準測試網(wǎng)站?;鶞蕼y試的范圍往往很廣,涉及CPU技術的不同方面,因此,如果處理器在執(zhí)行整數(shù)運算方面速度很快,但在浮點運算方面不太擅長,反之亦然,這些特征就會在結果中顯現(xiàn)出來。
隨著當前對環(huán)保硬件的推動,CPU芯片通常采用所謂的效率模式(使用E核)或性能模式(使用P核)。雖然這對于運行數(shù)據(jù)庫應用程序的計算機來說可能非常有用,因為CPU不經(jīng)常被請求,或者對于一個移動設備電池消耗可能是個問題,但對于插入主電源的計算服務器系統(tǒng),效率模式會妨礙性能。確保您選擇的CPU能夠禁用效率模式,或者至少強制始終性能模式。
如今,大多數(shù)CPU都支持超線程,雖然超線程對于某些傾向于交互式且持續(xù)時間較短的應用程序很有用,但在考慮MSC Nastran計算時,經(jīng)驗表明,禁用超線程會有助于提高性能。您將知道系統(tǒng)上是否啟用了超線程,因為邏輯CPU的數(shù)量將使整個CPU插槽的內(nèi)核數(shù)量增加一倍;超線程使CPU看起來擁有比實際更多的內(nèi)核。
每一代新一代CPU 都帶來了新的邏輯來加速運算,例如通過巧妙地訪問CPU中的寄存器來聚合操作,或者流水線,以便在單個CPU時鐘周期內(nèi)實現(xiàn)多個運算。過去,我們看到了流式SIMD擴展SSE、SSE2、SSE3、SSE4 和高級矢量擴展AVX(Gesher 新指令)、AVX2(Haswell 新指令)、AVX-512、AVX10 和最近的高級性能擴展APX。
最重要的一點是,MSC Nastran的開發(fā)努力支持最新的編譯器和供應商庫,而這些編譯器和供應商庫又支持最新的擴展,因此,一般來說,如果您的系統(tǒng)上有可用的功能,它們將被使用。如果沒有這些功能,也不影響使用。這種兼容性和定期引入新功能是采用最新版本的MSC Nastran軟件的充分理由。
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















