
發布
注冊
/
登錄代數求解器優化的案例
技術分享|并行代數多重網格算法:如何用黑盒求解器攻克復雜工程計算的效率瓶頸?
測試環境
測試CPU為sw26010處理器(僅使用主核),編譯選項只有-O3,UNAP的求解器參數設置如上示例所示,HYPRE的求解器參數設置如下:
HYPRE_BoomerAMGCreate(&solver);
HYPRE_BoomerAMGSetTol(solver, 1.e-6); /* conv. tolerance */
HYPRE_BoomerAMGSetMaxCoarseSize(solver, 50);
HYPRE_BoomerAMGSetMaxIter(solver, 100);
HYPRE_BoomerAMGSetMaxLevels(solver, 10); /* maximum number of levels */
HYPRE_BoomerAMGSetPrintLevel(solver, 0);
HYPRE_BoomerAMGSetRelaxType(solver, 0); // jacobi
HYPRE_BoomerAMGSetCoarsenType(solver, 8); // PMIS-8 HMIS-10
HYPRE_BoomerAMGSetup(solver, parcsr_A, par_b, par_x);
盡管在實際仿真求解過程中,針對 u、v、w 等分量的求解存在速度更快的迭代法可供選擇,但為了統一比較代數多重網格(AMG)方法在不同變量求解中的性能表現,這里對所有變量的求解均采用 AMG 方法,同時保持一些共有參數的一致性(如收斂準則、最大層數、最大迭代步數、最粗層粒度、smoother類型等),這里HYPRE的粗化策略選擇了PMIS并行粗化。
3. 測試結果
(1)算例1
①對于 u、v、w 等變量的求解,兩種方法的收斂速度大致相當。
展開 hyperstudy調用ls-dyna求解器求解優化 ¥180
最近很多人私信問我,hyperstudy怎么調用ls-dyna求解器,現對其做如下演示。
Ansys Lumerical | 使用 STACK 求解器優化 OLED
01 說明
此示例將使用 STACK 求解器來計算有機發光二極管(OLED)的提取效率和與角度相關的色偏。并在案例最后,將 Lumerical 優化后的結構光型輸出用于 Ansys SPEOS,讓設計人員可以在其中直接體驗納米級設計選擇如何影響人類感知。
02 綜述
首先在 STACK 求解器中搭建模型與參考文獻比較,對萃取效率與色偏討論。接著以一組優化的 RGB 像素發光特性為例,示范輸出給 SPEOS 的光源檔案。
步驟1:使用 STACK 重新創建測試微腔結果
在這一步中,我們模擬了來自文獻中結構: 器件1~3陽極使用 ITO,器件4~6則使用鋁,分別代表弱與強共振腔效應的器件,編號由小到大的器件分別對應電子傳輸層(ETL)厚度為[40,60,80]納米。
下圖為從 STACK 求解器與相關腳本 stackpurcell 函數得出的結果,是6個不同器件的輻射功率密度與波長、角度的關系。圖中可看出強微腔效應的器件, 峰值發射波長發生了顯著變化,且隨著角度的增加峰向更短的波長彎曲,即所謂的藍移,是強微腔中與角度相關的色偏主要原因。而弱微腔效應的器件峰值發射波長都為520納米,整個帶寬相對寬,如用于顯示器應用代表色彩純度差。而器件1~4,輻射功率密度在大角度下降很快,如在顯示器應用代表視角小。器件5與6雖然解決了視角問題,但波長明顯隨著角度變化,會引發明顯色偏。這些器件的差異證明了顏色純度和顏色失真之間的權衡。
下圖表示器件在極坐標下的歸一化場型,藍色曲線是 STACK 求解器的結果,與文獻的綠色曲線相當一致。也可從器件4-6中觀察到微腔效應如何影響視角范圍。
展開 TOSCA拓撲優化多處理器求解的問題
TOSCA具有多處理器求解的功能,這樣就可以實現對大型模型的優化計算。
一、TOSCA_GUI中的實現
如果要用多處理器進行優化計算,現階段TOSCA中只允許在靈敏度算法中進行添加設置。在優化任務界面的算法設定中,只能選擇下圖所示。
接下來,在command下拉菜單中選擇OPT_PARAM。
在OPT_PARAM界面中選擇PROCESSORS下選擇MULTI,就可進行多處理器計算。
二、TOSCA-ANSA環境中的實現
當TOSCA-ANSA環境進行優化計算的時候,首先要進行求解器的選擇,與TOSCA_GUI中的算法設置是一致的。
確定了算法之后,可以通過兩種方法進行設置的添加。
方法一:在優化任務設置的選項位置,點擊鼠標右鍵,選擇SETTINGS。
在跳出的選項卡片中,選擇PROCESSORS/MULTI。這個也與TOSCA_GUI中的選項一致,只是選項位置的變化。
方法二:使用界面中的Modules Buttons面板。首先確認使用的求解器,例如:ABAQUS。
接下來,在Modules Buttons面板中選擇SETTINGS功能區域下的OPT_PARAM。在彈出的窗口處,點擊鼠標右鍵,進行新建。
在彈出的新選項卡片中,進行設置。
TOSCA拓撲優化關于多處理器求解的問題.pdf
展開 
神威OpenFOAM——最流行的開源CFD軟件與神威·太湖之光的珠聯璧合
OpenFOAM與CFD(素材來源于網絡)
神威·太湖之光是世界首臺峰值性能超過每秒十億億次量級的超級計算機,作為“國之重器”,它為超大規模的科學與工程計算、更高保真度的數值模擬提供了強有力的硬件支撐。swOpenFOAM(基于神威平臺的OpenFOAM)正是與此強大硬件配套的CFD軟件。它不是簡單的代碼移植,而是根據神威超算的架構與特性,特別為OpenFOAM量身定制了一整套的優化方案。神威與OpenFOAM二者強強聯合,真正實現了1+1>2的效果。
swOpenFOAM優化之道
OpenFOAM求解CFD問題主要包括“預處理-求解-后處理”三個步驟,每個步驟的關鍵流程與面臨的問題如下圖所示。為了讓swOpenFOAM充分發揮神威的性能優勢,需要根據神威處理器的特點——異構眾核,詳細定制代碼移植與優化方案。同時,OpenFOAM求解過程中的三個關鍵環節:并行剖分、方程離散與方程求解,其對應的負載均衡、數據訪存和代數求解算法選擇等問題又與處理器架構息息相關。綜上所述,這“三位一體”的問題共同構成了swOpenFOAM所面臨的最大挑戰。
OpenFOAM在神威上的求解流程與關鍵性能瓶頸
01
基于處理器架構的優化
神威·太湖之光使用中國自主研制的“申威 26010”處理器,其特點是片上融合的異構眾核架構。每塊處理器包含四個“核組”,一個核組中集成了一個主核與64個從核。一個“申威 26010”處理器總共集成了260個運算核心,因此利用好從核是發揮神威性能的關鍵。
展開 技術分享︱突破大規模CFD仿真瓶頸:UNAP代數求解庫性能實測與優化解析
結合特定的前處理器,該軟件可以快速生成計算網格,從而為用戶提供從前處理到數值求解的完整解決方案。</p><p> 然而,隨著工程問題規模的不斷擴大,傳統代數求解器在處理大規模稀疏線性方程組時暴露出性能瓶頸。具體而言,現有求解器在并行計算中的通信開銷較大,尤其是代數多重網格(AMG)方法,難以充分發揮高性能計算平臺的并行潛力,從而限制了整體計算效率和擴展性。</p><p><strong style="color: rgb(15, 133, 214);"> 此次高性能改造的目標</strong>是對該CFD商軟中的代數求解器進行替換與優化,開發出<strong style="color: rgb(15, 133, 214);">性能更高、并行效率更好</strong>的數值求解模塊,以解決大規模并行通信開銷過大的問題。通過此次改造,<strong style="color: rgb(15, 133, 214);">期望顯著提升CFD軟件在大規模計算場景下的計算速度與可擴展性,為復雜工程問題的高效仿真提供支持。</strong></p><p><span style="background-color: rgba(1, 0, 0, 0);"> 結合軟件的主要使用場景,本次改造確定弱擴展性并行效率測試的環境為: 400萬以上網格算例,以單核為基準計算10倍擴展時的并行效率。
展開 代數求解器優化的相關專題、標簽、搜索
代數求解器優化求解器伴隨求解優化代數Optistruct求解器CFD求解器 優化設計仿真優化變壓器飛行器工程 hyperstudy調用ls-dyna求解器求解優化ansys拓撲優化求解器非線性求解器不收斂。 達到最大分離式迭代次數。 在 域常微分和微分代數方程: 線性求解器有錯誤消息。 相對誤差 (89) 大于相對容差。非線性求解器不收斂。 達到最大分離式迭代次數。 在 域常微分和微分代數方程: 線性求解器有錯誤消息。 相誤差 (89) 大于相對容差。workbench中拓撲優化中一直顯示優化求解出錯,請檢查求解器輸出comsol非線性求解器不收斂。 達到最大分離式迭代次數。 在 域常微分和微分代數方程: 線性求解器有錯誤消息。 相對誤差 (89) 大于相對容差。