
發布
注冊
/
登錄ansys并行效率的案例
Autodyn并行設置,并行效率及其影響因素的探討
針對Autodyn并行計算,和大家分享一點體會,同時希望看到的大佬能幫忙解答一點疑惑。
*首先介紹Autodyn的單機并行設置方法,并行MPI分為INTER和IMB,這里使用的是IMB,至于聯機并行我也沒有嘗試過o(╥﹏╥)o
在AUTODYN配置文件目錄下建立applfile和autodyn_mpi.bat文件,applfile無后綴;配置文件目錄默認為C:\Users\用戶名\AppData\Roaming\Ansys\v180\AUTODYN(v180為ANSYS版本號,如ANSYS2020則為v201)
編寫applfile文件內容為:
-e MPI_FLAGS=y0 -e ANSYS_EXD_MPI_TYPE=ibmmpi -h YYY -np 1 "D:\ANSYS Inc\v180\aisol\AUTODYN\winx64\autodyn.exe"
-h YYY -np 4 "D:\ANSYS Inc\v180\aisol\AUTODYN\winx64\adslave.exe"
編寫autodyn_mpi.bat文件內容為:
set MPI_ROOT=%AWP_ROOT180%\commonfiles\MPI\IBM\9.1.4.2\winx64
"%MPI_ROOT%\bin\mpirun.exe" -prot -e MPI_WORKDIR="D:\ANSYS Inc\v180\AISOL\AUTODYN\winx64" -f applfile
4. 雙擊執行autodyn_mpi.bat,將自動打開一個Antudyn GUI界面,載入模型,設置好模型的并行子任務分區,即可開始并行計算。
展開 Abaqus并行效率二三事
這也反映了一些現象,比如:某仿真平臺主打單位核時低廉,但是用戶租用他們的平臺跑仿真軟件,實際上付出了將近10倍的錢,工作效率卻沒有提升。平臺反而成為“自來水”推薦給其他同事使用,僅僅是因為表面上的價格便宜。
而神工坊平臺不一樣,我們對平臺上的多數仿真軟件進行了高性能適配,同時根據用戶需求進行兼容性適配。你用更多的核,就能獲得更高的并行效率,絕不花冤枉錢。
具體結論在前幾期的文章里有過細致的對比,歡迎回顧:
“神工坊”性能測試系列之二:Abaqus隱式靜力?學分析
“神工坊”性能測試系列之四:Abaqus顯式求解分析
本文介紹的Abaqus兼容性適配以及Abaqus并行效率優化方式只是其中的一些小技巧,更多的高性能適配方式需要很高的HPC并行計算基礎,目前就不再展開,歡迎持續關注我們后續的分享。
綜上所述,使用Abaqus進行有限元分析大有門道,特別是并行計算方面,
即使是相同的硬件資源,不同的并行模式和任務提交方式,所能發揮出的計算效率和并行效率也是有很大差別
。
“神工坊”高性能仿真平臺基于超算HPC集群的硬件支撐,對仿真軟件進行了CPU平臺的
高性能適配與優化
,相較其他仿真云平臺在計算效率和軟件適配度方面有較大的優勢,歡迎廣大仿真從業者注冊試用!
展開 Abaqus & AMD,兼容和并行效率的那些事~
這也反映了一些現象,比如:某仿真平臺主打單位核時低廉,但是用戶租用他們的平臺跑仿真軟件,實際上付出了將近10倍的錢,工作效率卻沒有提升。平臺反而成為“自來水”推薦給其他同事使用,僅僅是因為表面上的價格便宜。
而神工坊平臺不一樣,我們對平臺上的多數仿真軟件進行了高性能適配,同時根據用戶需求進行兼容性適配。你用更多的核,就能獲得更高的并行效率,絕不花冤枉錢。
具體結論在前幾期的文章里有過細致的對比,歡迎回顧:
“神工坊”性能測試系列之二:Abaqus隱式靜力?學分析
“神工坊”性能測試系列之四:Abaqus顯式求解分析
本文介紹的Abaqus兼容性適配以及Abaqus并行效率優化方式只是其中的一些小技巧,更多的高性能適配方式需要很高的HPC并行計算基礎,目前就不再展開,歡迎持續關注我們后續的分享。
綜上所述,使用Abaqus進行有限元分析大有門道,特別是并行計算方面,
即使是相同的硬件資源,不同的并行模式和任務提交方式,所能發揮出的計算效率和并行效率也是有很大差別
。
“神工坊”高性能仿真平臺基于超算HPC集群的硬件支撐,對仿真軟件進行了CPU平臺的
高性能適配與優化
,相較其他仿真云平臺在計算效率和軟件適配度方面有較大的優勢,歡迎廣大仿真從業者注冊試用!
展開 “神工坊”高性能工業仿真平臺|Fluent軟件并行效率測試
Fluent軟件并行效率測試
一、導言
Fluent軟件是ANSYS旗下一款通用CFD仿真軟件,市場占有率比較高,能夠進行流體、傳熱、化學反應等多種工程場景和模型的仿真分析。
二、 Fluent并行效率測試
1、模型介紹
本次測試共有兩個模型,一個是一個離心泵的空化仿真,是一個Mixture多相流問題,另一個是一個發動機內流仿真模型,兩個模型都來自于胡坤老師的公眾號,在原網格基礎上進行了加密。
表1 模型描述
2、并行測試方案介紹
本次并行測試基于國家超算無錫中心高性能仿真計算集群進行,計算隊列每個節點包含2路12核E5-2680V3處理器,主頻2.5GHz,每個節點128GB DDR4內存。
測試時分別使用了單核,24核(一個節點),48核,72核,96核及120核進行計算。
3、測試結果
并行測試結果如下所示:
4、測試結果對比
將case2的測試結果與Fluent官方及第三方超算測試情況進行對比,結果如下圖所示:
其中,Fluent官方測試案例是飛機機翼上方的外部氣流穩態流場仿真,網格規模1400萬;第三方超算測試案例是卡車車身外部穩態流場仿真,網格規模1400萬。
備注:因無法找到相同的仿真算例,故選擇了網格規模接近的算例進行對比,且各方測試并行規模也不完全一致,為方便對比,均轉換成按節點數進行對比(作者:周捍瓏)。
十四五期間,工業數字化將是工業轉型升級的主路線。“神工坊”秉持“算力賦能、協同創新”的理念,爭做“先進算力到仿真算能的轉換器”、“離散機理和垂直仿真場景的連接器”,助力我國工程仿真技術實現跨越發展,支撐重大裝備研制創新和工業設計研發數字化轉型。
展開 
一文讀懂Fluent并行計算,三大技術提升計算效率新境界!
隨著技術的不斷進步,Ansys工程師們致力于優化底層的并行算法,以提升其計算性能,使用戶體驗飛一般的計算速度。
在Ansys Fluent中,盡管工程師已經針對并行算法進行了充分優化,但在實際應用中,還有其他方法可以進一步提高計算性能。本文闡述了Fluent并行計算的基本原理,同時探討通過AVX2指令集加速、GPU加速以及超線程等技術手段來提高計算效率。
01 什么是Fluent并行計算
Fluent的并行求解器通過協同運作多個進程來計算大型問題,這些進程既可以在同一臺機器上運行,也可以在網絡中的不同設備上運行。
并行求解器將計算域分為多個區域(圖1),將各數據分區分配至不同的計算進程(稱為計算節點,圖2),每個計算節點都在其專屬數據集上同步執行同一程序。主進程(或稱為主機)不包含網格單元、面或節點(除非使用 DPM 共享內存模型),其主要職責是解析 Cortex(負責用戶界面和圖形相關功能的 Fluent 進程)發送的指令,并將這些指令(及數據)傳遞給某一計算進程,再由該計算進程將其分發至其他計算進程。
圖1:計算區域分區
圖2:分區網格邊界
計算節點負責存儲并執行部分網格的計算任務,而位于分區邊界的單層重疊單元格層則負責跨分區邊界的通信(圖2)。盡管單元格和面被分割,但網格中的所有域和線程在每個計算節點上均存在鏡像(圖3)。線程以鏈接列表的形式存儲,和串行求解器保持一致。計算節點可在大規模并行計算機、多CPU 工作站或具備相同或多工作站組成的網絡 上實現。 [1]
圖3:分布式網格中的域和線程鏡像
命令傳輸和通信
在Flunet并行計算會話中,進程涉及的主體包括 Cortex(主機進程)和一組 n 個計算節點進程,這些計算節點由 0 到 n-1 進行標記(圖4)。
展開 技術分享|并行代數多重網格算法:如何用黑盒求解器攻克復雜工程計算的效率瓶頸?
這一問題值得深入研究和分析,以提高其在不同場景下的穩定性和效率。
此外,我們還發現聚合型 AMG 方法在求解一些 p 方程等問題時,并行效率不盡如人意。這與網格分區和進程間獨立聚合的算法有著緊密的聯系,在一些問題中也會較大程度地影響收斂效率。因此,如何改進其聚合算法,以提升并行效率和收斂效率,成為了亟待解決的問題,值得我們深入探索和研究。
參考資料:
[1] Gerya T. The multigrid method. In: Introduction to Numerical Geodynamic Modelling. Cambridge University Press; 2019:292-318.
[2] Zong, Yi, et al. "FP16 Acceleration in Structured Multigrid Preconditioner for Real-World Applications." Proceedings of the 53rd International Conference on Parallel Processing. 2024.
?
展開 ANSYS的并行計算
對于接觸類非線性問題,搜索接觸單元及其計算過程都耗費大量的時間,在沒有超級計算機的情況下,做一個大型的像沖壓類的接觸分析需要成月的計算,而并行計算可以將大型的問題離散成幾個相關的部分,每一部分都分別同時計算,這樣就會大大減少求解時間。
所以請各位ansys這方面的專家和愛好者多多參與進來,進行討論。
ANSYS13 fluent并行出錯!
(10061)
Connect on sock failed,exhaused all end points
unable to connect to
sock error error=-1
存在網絡時,并行不會出錯,無網絡時,出現上述錯誤。原因是并行的mpich沒有進行注冊。
找到安裝mpich的文件夾下的bin文件夾下,運行MPIRegister.exe或是wmpiregister.exe程序(根據各個版本而不同),注冊一下用戶名和密碼,本機的登錄密碼。就可以在無網絡的情況下使用ANSYS了.
更深層次的原因是,在安裝時沒有進行MPI并行庫的安裝,如果有網的情況下,ansys自動選擇HP-MPI,這個雖然會提示no cached password orpassword provided,但不影響使用。
但在斷網的情況下,默認的是intel-MPI,這個庫最大的特點是需要注冊,并保存密碼,所以不經過這步是沒法使用的。
當然如果自己指定采用HP-MPI并行,應該不用進行注冊的操作,事實證明確實如此。
至此,該問題完全搞清楚!
展開 ANSYS Workbench 并行計算設置
復雜的結構分析、流體分析通常需要較長的計算時間,利用ANSYS
Workbench的并行求解功能,可以充分發揮計算機的性能,將仿真分析的求解時間大大縮短。
1.以一個靜力分析系統為例(如下圖)
2.雙擊上圖中靜力分析系統中的 Model,啟動分析界面如下圖
3.依次點擊主菜單的 Tools > Solve Process Settings,出現如下對話框
4.點擊上圖中的
Advanced
按鈕,在彈出的下圖對話框中,即可對并行計算的CPU數量、GPU加速情況進行設置。Workbench默認采用2核并行計算,可根據本地計算機的CPU配置進行設置,GPU加速需要符合ANSYS要求的硬件(顯卡)支持。
展開 ANSYS Workbench并行計算及其他基礎設置教程 ¥1
首先,ANSYS的大部分設置都可以Tools——options里設置:
Beta Options設置:測試模式,如果在單擊Appearrance,勾選Beta Options模式,則會在軟件中顯示一些還處于測試階段的功能,默認是被隱藏的,顯示后會在該功能模塊后添加(Beta)。
regional and language options:軟件語言設置,ansys 目前只支持四種語言,不包含中文,主要是日語,英語,德語以及法語。個人覺得,即使是推出了中文版,也建議大家使用英文版,因為在中國這個學術環境下,關于同一個物理概念,不同行業間都沒有統一的表述,即使翻譯過來,也不是適用于各個行業的,交流起來肯定會有隔閡,所以使用英語會更加方便。
3.并行計算設置:數值模擬常常是大規模的科學計算,一般依靠CPU浮點計算能力進行偏微分方程的求解(直接求解法的話更依賴于內存),使用多核心并行計算的方式可以提高計算性能。但是在使用前,必須進行相關的設置:
Tools-solution process-Default execution Mode,默認是serial(串行),下拉即可選擇Parallel(并行),雖然此時已經開啟了并行計算,但是軟件默認的可并行核心數為2,因此需要更改相應核數,在并行串行計算設置下方可輸入核數,并且在solution process下方的Mechanical APDL中,processors中可以設置相應核數。一般可設為20核,此處設置的核心數如果超過了計算機實際的物理核心,求解時會發生警告,但不影響計算。
展開 【11月15-16日 深圳】ANSYS官方培訓—ANSYS高速串并行總線高精度建模與自動化分析
ANSYS高速串并行總線高精度建模與自動化分析
培訓背景
隨著信號傳輸速率的提高,電子設備中的串并行總線信號越來越多。這些高速GHz信號具有傳輸距離遠、容量大、布線方便的優點等諸多優點,然而在應用中也存在高速信號完整性問題。 在電路設計層面上,高速信號電路面臨復雜的時序、眼圖、抖動等指標,以及嚴重的碼間干擾(ISI)問題。而傳輸線、過孔等結構等在高頻信號下的趨膚深度等高頻特性也都極大影響系統性能
ANSYS是業界領先的CAE仿真軟件供應商,其針對高速串并行鏈路的設計需求和挑戰,提供了完整的設計流程和方案。可以幫助設計者完成從傳輸線、過孔建模,全波電磁仿真,系統鏈路分析等仿真設計。其中,HFSS作為全波電磁仿真的黃金工具,在業界一直廣受推崇,其提供了高效高精度的電磁場算法,而最新版本中集成的HFSS 3D Layout功能,為工程師提供了更加熟悉的EDA設計環境,可以快速高效的分析各類高速信號設計問題。
本次培訓主要針對PCB硬件、Layout及SI工程師,內容包括高速串并行鏈路的仿真方法和手段,為提升相關科技工作者的技術水平,普及ANSYS軟件高級功能。因此,ANSYS公司特開辦“ANSYS高速串并行總線高精度建模與自動化分析”。
培訓合格者發放ANSYS技術培訓認證證書。
展開 
ANSYS Workbench并行計算設置-燃燒吧,電腦
在ANSYS WB計算時,很多人都想把電腦的設置發揮大最佳以獲得最短的計算時間,本文基于ANSYS2019R2版本,給大家介紹部分并行計算的設置,以發揮電腦的最大性能
1.WB主界面Tools中option的設置
(1)選擇左側的solution process,在Default Execution Mode下拉菜單選擇Parallel。
在Default Number of Process處講默認的2更改為你自己電腦實際的物理核數,因我的電腦是12核,所以該處改為12.
(2)選擇左側的Mechanical APDL,將Database Memory(MB)改為更大,此處可根據需要更改,同樣的將Workspace Memory(MB)改為更大,也是根據需求適當更改,將 Process改為自己電腦實際的物理核數,此處我的電腦是12。
另外,在option中介紹幾個其他的小設置。
①.如果你不想在最后的截圖中顯示你的版本號和ANSYS的LOGO,可以在Appearance中選擇關掉,而且還可以在該處更改各種背景的顏色。向下拉勾選Beta Option,可以在整個軟件中調出ANSYS中所有的測試功能。
②.目前市面上大部分教程中的三維建模還是以DM為主,但是從18.0開始,ANSYS系統默認選擇SCDM,如果需要改為DM,則選擇Geometry Import中,Preferred Geometry Editor下拉菜單選擇DM即可(在這里個人推薦大家學習一下SCDM,我的之前的教程也是以SCDM為主的)。
展開 Ansys Fluent 提交并行求解作業到Slurm系統的介紹 | HPC
目前,Ansys軟件也支持使用Slurm來完成并行求解作業的任務提交和管理,本文介紹Ansys Fluent 2023R1版本并行求解作業提交到Slurm系統的相關操作。
一. Ansys RSM方式提交
1、首先在Linux集群管理節點啟動Ansys RSM Launcher服務。
2、打開Windows端的“RSM Configuration 2023 R1”配置工具,完成Slurm資源的添加配置。
3、打開Windows端的“RSM Cluster Monitoring 2023 R1”工具,可以看到剛配置完成的Slurm隊列的資源狀態:2個計算節點(node1和node2),每節點8個CPU Core。
4、在Ansys Workbench中打開Ansys Fluent測試算例,并按圖示1~4步驟的操作說明,完成Fluent作業的遠程提交。如果項目中有多個待分析任務的話,建議使用右鍵菜單的Update選項,來準確定位要提交求解的分析任務。
5、打開“Job Monitor”工具,查看運行中的作業狀態。
6、Linux管理節點上,我們也可以通過squeue命令查看運行中的Slurm作業的狀態。
7、計算完成后,計算結果自動傳回Windows主機上的項目文件目錄,我們在本地完成后處理工作。
展開 Ansys Workbench利用超單元子結構技術,提升大模型計算效率 ¥10
Ansys針對這類工程問題提供模態綜合法(CMS)利用超單元,將非關鍵部件進行縮減計算。
本文根據查閱到的網絡資料,對超單元縮減計算如何在Ansys Workbench 中實現,進行了介紹。
示例:
工業設計產品需要模擬工作環境進行振動試驗,產品本身結構已經很復雜,再加上工裝往往是一個更大的結構。因此這類仿真計算非常適合適用子結構技術,將工裝等大模型進行超單元縮減計算,可以顯著提升計算效率。
如下圖所示,產品+工裝進行振動模擬仿真,仿真產品結構模態和端點的振動響應加速度曲線。
結果展示:
使用超單元縮減計算,可以有效完成復雜模型的計算需求。且計算結果基本一致。
詳細步驟:
模型說明:
? 產品由PartA和PartB兩個部分構成,其中PartA兩端夾持部位做了共面處理(驗證連接關系,可以忽略);
? 各個零件的連接面有一定間隙,使用Bonded MPC Radius 3mm 連接;
? 約束工裝底面 fix;
一:產品+工裝完整模型計算
產品+工裝一起進行模態和5-2000Hz的諧響應仿真,提取前6階模態和軸端點的加速度響應,作為驗證結果與子結構方法進行對比。
1、模態計算
模態計算結果如下所示。
2、模態疊加法,諧響應掃頻計算
諧響應掃頻提取端點加速度響應以及688Hz、1620Hz處的應力云圖如下所示。
二:子結構,超單元縮減工裝進行簡化計算
1、 工裝模型進行超單元縮減
? 首先,由工裝+產品的模態計算模塊,復制一個新的模態計算模塊;
? 在新模態計算模塊中只保留需要縮減為超單元的工裝模型,其余模型均做supress抑制。
展開 ANSYS Mechanical 2022 新功能:單元、接觸、斷裂力學、并行計算
本期是ANSYS Mechanical 2022 功能更新之單元、接觸、斷裂力學、并行計算。
文末領取學習資料
下面我們看看具體的更新內容:
一、單元部分
增強單元性能加強
面增強單元的彎曲剛度
使用單軸剛度單元進行反向求解
耦合單元的增強
運動副單元增強
二、接觸部分
基于Dual Shape函數的接觸算法
新的自適應小滑移選項
殼-實體組裝件的準確性改進
螺栓預緊支持通用軸對稱單元
網格獨立點焊增強功能
瞬態動力學精度改進:HHT算法
力矩收斂參考值計算穩健性改進
三、斷裂力學
基于應力比率的疲勞裂紋閉合
Paris定律與裂縫閉合效應相結合
應力比率(R)相關的疲勞裂紋擴展規律
靜態裂紋擴展的溫度/時間相關斷裂準則
自適應裂紋初始化/插入
3D界面單元
動態裂紋擴展尺寸控制
四、求解器效率提升
資源預測增強
分布式求解增強
文章篇幅有限
下圖微信掃碼領取完整版學習資料
展開