
發布
注冊
/
登錄ansys計算加速的案例
ANSYS加速仿真計算硬件配置建議
Ansys 工作負載對內存帶寬和計算能力都有很高的要求,而這些要求會因多種因素而異,包括數據集的大小和所使用的求解器。多年來,我們與高性能計算 (HPC) 合作伙伴攜手合作,積累了豐富的經驗,深知均衡的硬件解決方案能夠最大程度地提高您在硬件和 Ansys 軟件方面的投資回報。換句話說,投資于能夠加速特定 Ansys 應用的技術才是明智之舉。
以下是關于如何選擇關鍵硬件技術以增強 Ansys 仿真運行的一些建議。
選擇最適合模擬的處理器
我們先來選擇合適的處理器。我們的一些應用程序,例如 Ansys Mechanical、Ansys HFSS 和 Ansys LS-DYNA,都使用了 Intel 高級矢量擴展 512 (AVX512) 指令集,因此在 Cascade Lake SP 62xx 和 AP 92xx 系列的 Intel Xeon 可擴展處理器上性能非常出色。
雖然高時鐘頻率的處理器通常是理想之選,但對于運行在大型集群上的 Ansys 應用(例如 Ansys CFX、Fluent 和 LS-DYNA)而言,其重要性并非那么突出。在大型集群中,通信吞吐量比計算速度更為重要,因此處理器速度并非那么關鍵。
通常不建議選擇核心數最多的處理器,因為如果CPU內存沒有相應增加,可能會對內存帶寬產生負面影響。大量的核心可能會降低CFX、Fluent和LS-DYNA的性能,這些軟件通常運行在大型集群上。如需了解更多信息,請下載《適用于Ansys Mechanical和Fluent工作負載的Intel處理器選擇》 白皮書。
選擇合適的記憶方式
對于大多數 Ansys 應用來說,選擇足夠的內存 (RAM) 至關重要,這樣才能實現“核內”求解,避免將數據分頁到硬盤(“核外”),后者通常速度較慢。
展開 Ansys進一步加速高性能計算和人工智能設計
通過將世界一流的Ansys HFSS和Ansys RaptorX引擎整合到統一的分析解決方案中,Ansys將提供一種即時的解決方案,以有效解決多個高速和高性能應用中的電磁效應。作為全球電磁領域的領導者,Ansys很驕傲這次能在繼承原有資產的基礎上全新推出Ansys RaptorH。”
來源于:ANSYS官網
Ansys進一步加速高性能計算和人工智能設計
圖為納米級片上系統(SoC)的塊視圖,該分析展示了由HFSS黃金標準所提供支持的RaptorH的驚人容量
Ansys RaptorH是一款高度集成的分析解決方案,使設計人員能夠仿真在多芯片3D-IC、硅interposer和高級封裝上的高級納米硅設計的電磁現象,從而縮短設計周期并提高可靠性與完整性。
Ansys副總裁兼總經理John Lee表示:“設計新一代電子產品的企業面臨著日益嚴峻的上市時間壓力,因為他們要在容易出錯且成本高昂的工作流程中努力解決極為復雜的設計挑戰。通過將世界一流的Ansys HFSS和Ansys RaptorX引擎整合到統一的分析解決方案中,Ansys將提供一種即時的解決方案,以有效解決多個高速和高性能應用中的電磁效應。作為全球電磁領域的領導者,Ansys很驕傲這次能在繼承原有資產的基礎上全新推出Ansys RaptorH。”
展開 Ansys進一步加速高性能計算和人工智能設計
Ansys RaptorH為芯片設計團隊提供業界領先的HFSS求解器技術
2020年2月25日,匹茲堡訊 –隨著Ansys? RaptorH?的正式發布,Ansys(NASDAQ:ANSS)將進一步為工程師加快和改進5G、三維集成電路(3D-IC)和射頻集成電路設計工作流程賦能,推動智能設備、天線陣列和數據存儲系統等方面的創新。RaptorH集結了Ansys旗艦產品HFSS的保真度與RaptorX的速度和高容量架構,幫助設計人員縮小芯片尺寸、降低功耗、減少生產成本并最大限度地加快產品上市進程。
從用于5G移動設備和網絡基礎設施的高性能片上系統(SoC),到實現自動駕駛汽車和工業物聯網的射頻收發器,電磁對電路設計的影響極為關鍵。Ansys RaptorH能有效幫助客戶解決不良干擾,避免可能導致設計周期延長、風險增大、成本升高以及性能不理想等不良影響。
Ansys RaptorH是一款高度集成的分析解決方案,使設計人員能夠仿真在多芯片3D-IC、硅interposer和高級封裝上的高級納米硅設計的電磁現象,從而縮短設計周期并提高可靠性與完整性。
Ansys副總裁兼總經理John Lee表示:“設計新一代電子產品的企業面臨著日益嚴峻的上市時間壓力,因為他們要在容易出錯且成本高昂的工作流程中努力解決極為復雜的設計挑戰。通過將世界一流的Ansys HFSS和Ansys RaptorX引擎整合到統一的分析解決方案中,Ansys將提供一種即時的解決方案,以有效解決多個高速和高性能應用中的電磁效應。作為全球電磁領域的領導者,Ansys很驕傲這次能在繼承原有資產的基礎上全新推出Ansys RaptorH。”
關于ANSYS, Inc.
作為全球工程仿真領域的領先企業,Ansys在眾多產品的創造過程中都扮演著至關重要的角色。
展開 
12/21 基于Ansys Speos的GPU光學模擬加速計算
Ansys與NVIDIA有著長久的戰略合作關系,作為高性能計算領域的技術領導者,雙方展開密切合作在Ansys多物理場解決方案中開發GPU加速求解器和算法,確保在Ansys軟件上運行的仿真工作具有最快的性能。此外還在專業圖形方案領域進行合作,確保Ansys在建模、后處理和可視化等工作流程能夠發揮最佳性能和質量水平。
當下隨著科技的發展,汽車內外飾照明越來越復雜,以往想要模擬出高逼真的視覺效果,需要堆棧CPU數量用于模擬計算,硬件成本很高。而在即將正式推出的Ansys Speos GPU加速計算中,可實現4-8倍運算能力的提高,通過借助GPU加速獲得更好的結果、更快的模擬以及更高的精度和分辨率,實現基于物理的逼真渲染,消除時間/硬件管理等障礙,進一步加快開發速度。
12月21日,Ansys將聯合NVIDIA共同推出【基于Ansys Speos的GPU光學模擬加速計算】網絡研討會,本次會議邀請來自NVIDIA 行業拓展經理茅勇,以及Ansys Speos應用工程師孫鴻燁作為主講嘉賓,共同分享實現快速計算的關鍵技術以及最新光學仿真的功能革新,歡迎大家報名參會。
展開 Ansys進一步加速高性能計算和人工智能設計
Ansys副總裁兼總經理John Lee表示:“設計新一代電子產品的企業面臨著日益嚴峻的上市時間壓力,因為他們要在容易出錯且成本高昂的工作流程中努力解決極為復雜的設計挑戰。通過將世界一流的Ansys HFSS和Ansys RaptorX引擎整合到統一的分析解決方案中,Ansys將提供一種即時的解決方案,以有效解決多個高速和高性能應用中的電磁效應。作為全球電磁領域的領導者,Ansys很驕傲這次能在繼承原有資產的基礎上全新推出Ansys RaptorH。”
來源于:ANSYS官網
展開 9/24 Ansys Discovery 運用NVIDIA 最新工業級GPU技術加速仿真計算
Ansys Discovery是專為設計工程師開發的實時仿真設計工具,能為他們在概念設計階段提供包括幾何建模及清理、結構、模態、熱及流體(內流及外流)以及拓撲優化等一系列設計及分析功能。借助全新的Ansys Discovery,工程師能夠在概念評估、設計改進優化階段盡早利用仿真推進研發,這意味著工程師能夠在有限的預算中更快地優化產品與工作流程。
同時,在NVIDIA GPU的助力下,Ansys Discovery能夠提供即時 3D 設計仿真功能,實現實時交互設計探索和快速產品創新。基于NVIDIA CUDA的Ansys產品可將幾小時的設計模擬工作流程縮短為幾分鐘甚至幾秒,助力設計工程師以更快的速度做出更明智的設計決策。本次網絡研討會,我們邀請到NVIDIA高級解決方案架構師宋毅明,以及Ansys中國高級應用工程師鄭偉巍共同為大家講解Ansys Discovery 運用NVIDIA 最新工業級GPU技術如何以更快的速度探索概念、執行迭代與創新。歡迎報名參會!
時間:9月24日(星期四),14:00-15:00
會議大綱:通過觀看本次網絡研討會,您將學習到,
NVIDIA Quadro系列產品介紹
NVIDIA CUDA如何加速仿真計算及流程
Ansys Discovery產品介紹及仿真精度
Ansys Discovery在行業中的應用案例
講師簡介:
宋毅明,NVIDIA Quadro 產品部門高級解決方案架構師。南京大學計算機軟件工程方向碩士畢業。曾在 AMD、Intel 從事 3D 圖形驅動開發,在 epic games 從事 UNREAL 游戲引擎開發工作。對計算機圖形學、directx 游戲引擎開發優化有深刻理解。
展開 ANSYS和SYNOPSYS將展開合作,加速優化新一代高性能計算、移動和汽車產品的魯棒性設計
ANSYS和SYNOPSYS將展開合作,加速優化新一代高性能計算、移動和汽車產品的魯棒性設計:獨有的產品集成,可將電源和可靠性驗收解決方案與內建設計分析的物理實施解決方案充分整合,進而推動未來智能產品的研發http://www.ansys.com/zh-CN/About-ANSYS/news-center/06-19-17-ansys-and-synopsys-partner
異構加速計算崛起,不應只是關注計算芯片
以近藤正明教授為首的研究人員等專家在《下一代高級計算基礎設施白皮書》中預計,未來將需要“專用或半專用硬件加速器”作為這十年計算的必備功能。 ”以及 Hennessy 和 Patterson 在他們的論文“計算機架構的新黃金時代”中。
As long as we are talking about dedicated accelerators, why stop at GPUs? Optimizing for different types of accelerators is a great objective, but we don’t want to write different code for different types of accelerators. We believe that the industry will benefit from a standardized language, that everyone can contribute to, collaborate on, is not locked into a particular vendor, and can evolve organically based on its members and public requirements.
既然我們談論的是專用加速器,為什么只停留在 GPU 上呢? 針對不同類型的加速器進行優化是一個偉大的目標,但我們不想為不同類型的加速器編寫不同的代碼。 我們相信,該行業將受益于標準化語言,每個人都可以做出貢獻、進行協作,不會被鎖定到特定的供應商,并且可以根據其成員和公眾要求有機發展。
展開 高性能計算(HPC)服務器加速LSDYNA計算效果展示
分享幾個我司為客戶提供的高性能計算服務器案例,LSDYNA軟件提速數倍。
1. 如下圖,客戶采用自有的工作站進行射流沖擊仿真,運行至250微秒用時3天多,我司服務器運行至250微秒只需3小時,提速24倍+。
2. LSDYNA爆炸仿真,客戶自己電腦用時28小時,我司集群3小時完成,提速8倍。
3. 某高校客戶,爆炸仿真,客戶租用工作站12小時只跑了1000微秒,而我司服務器跑完6000微秒用時57分鐘,提速72倍+。
4. 某軍工客戶,爆炸仿真,客戶原有電腦需運行155小時,我司工作站僅需5.3小時,提速29倍。
如有需要采購服務器、建設高性能計算集群的單位歡迎聯系。后續將發布StarCCM、Fluent、Abaqus等各行業客戶使用我司服務器后的性能提升案例。
展開 如何加速Map圖計算?
電功率與每周期時間步數曲線
軸功率與每周期時間步數曲線
對于電動機模式:
對于發電機模式:
在計算Map圖時,每個周期的時間步數不宜設置過大,可以采用默認的30步(或者加大到40~60),可平衡計算速度和精度。
(2)周期數
Maxwell基于磁場分析結果,通過后處理的方式計算鐵心損耗,磁場幅值的建立至少需要半個電周期,計算Map圖時,對于永磁同步電機,周期數設置為2即可,如果使用半周期TDM,可以只計算半個電周期。
(3)參數掃描變量數的設置
首先是電流和電流相位角的掃描設置,Toolkit使用非線性DOE采樣,默認的6*10是較平衡的設置,如需進一步提高精度,可在每個維度增加3~5個點。其次是轉速點的設置,從2020R1開始,對于同步電機,Toolkit可取消對轉速變量的掃描,取消勾選Specify number of speed sweeppoints,或者直接設置為1即可激活該功能,由于減少了一個掃描維度,計算量大幅降低,當鐵損系數與轉速無關時,建議使用該功能。
6 測試案例
為此,本文拿一個例子來進行測試,測試計算Map圖所需的時間,本文開啟DSO設置,Tasks= Cores = 8,一次性計算8個任務,最終用時18分鐘就把Map圖結果計算完成了,軟件版本為2020R2,相關參數設置如下。
DSO設置及計算過程:
Map計算結果:
軟件版本為2020R2,電腦硬件配置如下:
7 總結
通過設置周期模型、合理設置網格剖分、打開DSO及LSDSO加速計算、合理的ACT參數設置等操作后,軟件可以在很短的時間內將電機的Map圖結果計算出來,如本文所述案例,在18min內就可將結果計算完成。
展開 
用GPU加速Fluent計算
用Fluent開啟GPU進行計算,過程其實很簡單,不過現在只找到采用N卡進行計算的方法。首先在開始界面需要設置并行計算的核數與你要用來計算的GPU數量,一般電腦都只有一塊顯卡,所以設置為1就可以了。
打開之后就需要用命令行去打打開顯卡計算并進行設置,命令行/solve/set/amg-options/amg-gpgpu-options/,后面還需要跟上你想并行計算的模型比如我這里的壓力耦合計算,后面是一些精度和求解方法的設置,其中精度和迭代次數比較重要,搞得不好反倒會發散,比如這里設置為0.1,如果過大那時間就會比較長。
設置好了之后運行就可以了,也沒什么需要注意的,但是有的模型本身就有限制用不了并行加速方法,具體的可以參考這里的內容https://www.nvidia.cn/data-center/gpu-accelerated-applications/ansys-fluent/
我這里模型比較小,計算時間就2分鐘效果提升不明顯,大的模型會明顯一些,但顯卡確實用起來了。
如果是自己編寫的程序想并行求解的會麻煩很多,但也不是沒有辦法。
后續更新如何用代碼主要是基于matlab進行三維模型計算,包括讀取網格(基于Openfoam格式的網格),處理拓撲,離散求解一系列流程。
展開 John Glossner:新一代異構計算正在成為人工智能的加速引擎,中國是全球異構計算生態的重要一
如果按照馬云的觀點,數據是人工智能的生產資料,計算是人工智能的生產力,那么異構計算就是提升人工智能生產力的引擎。
9月17日,在2018世界人工智能大會的主論壇上,全球異構系統架構(HSA)聯盟主席John Glossner博士發表了《面向人工智能的新一代異構計算標準》的演講。John Glossner在演講中以華夏芯(北京)通用處理器技術有限公司的異構多核處理器平臺為例,介紹了最新的人工智能芯片的設計趨勢。他還表示,中國是全球異構計算生態的重要一環。異構計算是一種將不同指令架構的計算單元(例如傳統的CPU、GPU、DSP、還有創新的TPU、DLA等)融合在一起、實現高效協同運行的計算技術。如果說傳統架構的芯片是一種燒汽油的引擎,那么異構計算的芯片就是一種混合動力引擎,甚至新能源引擎。
John Glossner主席認為,大量人工智能應用的出現,如無人駕駛、機器視覺、智能手機等等,對于人工智能的發動機——芯片,提出了非常高的要求,包括性能、功耗、成本、應用開發等等。芯片既是人工智能持續增長的動力引擎,又是人工智能規模化商用的算力瓶頸。面對大數據、人工智能對計算性能的爆發式需求,各種創新的神經網絡算法及相應的計算實現架構層出不窮,之前的傳統芯片設計架構已經難以滿足應用對計算能力的需求。正因為如此,不僅眾多創新的芯片公司,甚至包括亞馬遜、百度這些互聯網公司都在開始設計新架構的人工智能芯片。異構計算這種將傳統與創新架構融合、通用和專用計算協同的技術路徑,非常好地滿足了人工智能芯片不僅要性能好、成本低,還要可演進、易開發的設計理念。因此,業界的共識是新一代異構計算架構是未來人工智能芯片設計創新的主要突破口。
異構計算并不是全新的概念,但由于產品設計難度大、生態系統需要重新構建等挑戰,在過去很長一段時間里一直處在不斷演進當中。
展開 深度解讀 NVIDIA 加速計算平臺如何推動人工智能、元宇宙、云技術和可持續計算的下一波浪潮
黃仁勛將深度解讀 NVIDIA 加速計算平臺如何推動人工智能、元宇宙、云技術和可持續計算的下一波浪潮。
NVIDIA 創始人兼首席執行官黃仁勛的 GTC 主題演講將于北京時間 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中國重播。
掃碼或點擊下方鏈接
鏈接:https://www.nvidia.cn/gtc-global/keynote/?ncid=ref-io-415248
探索全球思想領袖的宏圖大略
您還可以通過本次 GTC 探索來自各行各業思想領袖的宏圖大略。重磅演講嘉賓包括 DeepMind 創始人兼首席執行官 Demis Hassabis、Open AI 聯合創始人兼首席科學家 Ilya Sutskever、Adobe 首席產品官 Scott Belsky,和 IBM 公司首席信息官 Kathryn Guarini 等。
更多重磅專題演講將接連登場,切勿錯過全新的突破性內容、由專家主持的會議和必看的主題演講。
展開 LMS Virtual.Lab 聲學計算加速
顧名思義,就是講了VL進行聲學計算時候一些計算資源管理的問題,包括如何占用內存,如何進行大型并行計算,如何用模型自由度估計所需要的內存和CPU時間,最后講了一些合理建議,比如選擇不同的求解器(如ATV)或者方法(如迭代法),來加快計算,從而使你工作效率更高!希望這個帖子對大家有一定幫助!謝謝!
pres_Solver.pdf