
發布
注冊
/
登錄單機多核的案例
Optistruct實現單機多核mpp計算方法 ¥5
Optistruct實現單機多核mpp計算方法
lsdyna mpp for Windows-實現LS-DYNA單機多核MPP并行計算交互界面軟件 ¥99
看到很多同行疑問如何在獨立版LS-Dyna-MPP求解器中實現并行計算,在此提供大家一個提交并行計算的GUI交互軟件(配合mpi軟件),方便大家實現LS-Dyna-MPP并行求解計算,僅供大家學習交流,提升工作效率。
純技術干貨,dyna-mpi-mpp資料打包在一起,一站式購買安裝即可使用,值得珍藏擁有。
收費內容主要包括:
1)lsdyan-mpp軟件下載及安裝,含設置dyna環境變量
2)Mpi軟件及環境變量設置
3)一款可實現dyna-mpp并行計算的交互軟件
4)各軟件主要的安裝步驟及環境變量設置,僅供個人學習和實現dyna單臺電腦實現mpp并行計算,切勿商用。
備注:實用資料供愛好學習的你,記得關注并點贊哦。
收費內容主要包括:
1)lsdyan-mpp軟件下載及安裝,含設置dyna環境變量
2)MPI軟件及環境變量設置
3)一款可實現dyna-mpp并行計算的交互軟件
4)各軟件主要的安裝步驟及環境變量設置,僅供個人學習和實現dyna單臺電腦實現mpp并行計算,切勿商用。
備注:實用資料供愛好學習的你,記得關注并點贊哦。
展開 用個小招數解決ANSYS運行內存不夠的問題
4.CPU設置方面,選用CPU的數量為物理核心-1,為系統留一個核心,以免死機就行,原則上核心用的越多,就用越多的系統資源來計算,效果越好。至于設置的方法,存在兩種模式:SMP和MPP.
SMP Shared-Memory parallel 共享內存,適用于單機多核并行(針對于本機)
特點:
1) 超過2個處理器(核)后,每個處理器(核)都需要一個HPC licenses (High Performance computing),一個HPC licenses可以支持兩個處理器(核),比如4個處理器或兩個雙核的處理器,需要2個HPC licenses
2) 物理內存連續,即所有即將使用的處理器共用一個物理內存, 比如dual或者quad cores 的處理器
適用于:
1)大多數,并不是全部的/Solu過程可以并行
2)適用于/solu中的較多的求解器。
展開 LS_DYNA-MPP 多核并行計算資料分享
另外需要lsdyna-mpp個人電腦實現單機多核mpp并行計算軟件的請在https://www.yqgqt.org.cn/content/post/541092 鏈接中下載試用。

【轉】fluent中隱藏模型的開啟
以下為部分隱藏模型的開啟方法:
1.并行模式(僅適用于單機多核情況)
在windows“開始/運行”中輸入“fluent 2d -t2”,其中“2d”表示2d求解器,"t2"表示用兩個核心進行并行計算。需要注意的是,有的機器需要在“開始/運行”中輸入fluent的完整路徑,比如“C:\Fluent.Inc\ntbin\ntx86\fluent 2d -t2”。
2.大渦模擬
在fluent界面中輸入命令“(rpsetvar 'les-2d? #t)”,然后按回車就行了。需要注意的是括號不能少,另外好像是需要手動輸入的,直接粘貼的話有可能不行。
3.低雷諾數模型(高版本的fluent中不需要TUI設置了)
首先選中k-e模型,然后在fluent界面中輸入“de/mo/v/t”,回車。此時會出現三個模型選項,然后輸入“low",回車,輸入“y”,回車。這樣你在k-e模型下就發現多了個低雷諾數選項。另外兩個專家模型,大家有興趣的話也可以研究一下。
4.電磁流體模型
讀入你的case,然后在fluent界面中輸入“de/mo/add”,回車,此時出現5個隱藏模型選項,選擇第一個就是mhd模型了。需要注意的是只有先讀入cas之后,才能調出該模型。
5.網格修補
fluent讀入網格時,特別是針對gridgen等第三方網格,有的時候會出現left handness的情況。在fluent界面中輸入“gr/mo/re-fa-ha”,回車。據說進行上述操作之后就有可能修復left handness的問題。(不過我一次都沒修復成功過)。
展開 巖土工程有限元軟件及其發展趨勢
08 從單機單核CPU計算到單機多核CPU,多機CPU并行,CPU-GPU混合并行和云計算
數值模擬分析軟件也應該順應計算機硬件技術的快速發展。目前,個人計算機已經從單機單核像單機多核發展。對于高性能計算,還需要多機并行處理。這使得依賴于計算機硬件的軟件系統必須適應硬件的發展,達到更加有效地進行數值模擬和計算。例如,ABAQUS在生成任務時會選擇使用幾個CPU來進行計算,ANSYS也提供了分布式并行計算功能。ABAQUS可以使用單機多核(CPU)技術。未來還要向多機多核并行計算發展。
近年來,計算圖形處理器(GPU-Graphics Processing Units)技術發展迅速,其應用范圍已經從單一的圖形處理擴展到通用數值計算。由于GPU具有流處理、可編程流水線和高密度并行處理能力,與CPU 相比,GPU具有更強的浮點運算能力,通常擁有一個或更高數量級的浮點運算速度。由于具有高性價比和低功耗等優點,GPU已經成為高性能通用計算的一種選擇。由于GPU在高強度浮點計算方面具有獨特的優勢,采用CPU-GPU混合計算來求解一個問題也可能成為未來有限元計算的一個趨勢。
云計算是一種新興的資源使用和交付模式,通過交付和支付的方式有效利用互聯網分布式計算資源和計算能力,它是一種區別于網格計算、效用計算、自主計算的一種新型計算模式。
展開 【白話IC】揭秘20000個VCS任務背后的“搬桌子”系列故事
我們看看從第一階段到第二階段的實際VCS驗證效果:
應用并行化驗證
400個任務
對VCS進行多任務并行化處理后,一臺單機運行相同VCS任務的時間縮短為原先的15%-16%,極大提升了運行效率。
實證過程:
1、使用一臺單機C1(8核)運行400個VCS任務,耗時806分鐘;
2、使用一臺單機C2(8核)運行400個VCS任務,耗時793分鐘;
3、對VCS應用進行多任務并行化處理后,使用一臺單機C1(8核)運行400個VCS任務,耗時130分鐘;
4、對VCS應用進行多任務并行化處理后,使用一臺單機C2(8核)運行400個VCS任務,耗時122分鐘。
第三階段:多機多CPU核,多任務
多任務狀態下的多機多核,就是多個任務能同時在數臺機器的數個CPU上跑,這個我們稱之為集群化管理,一般都需要有調度器的參與。
關于調度器的相關知識,看這里:億萬打工人的夢:16萬個CPU隨你用
前面講到我們已經可以同時安排搬兩張桌子啦。
但其實,如果你的機器足夠多,人(CPU核)足夠多,你完全可以同時搬更多的桌子。
這個時候,必然要面臨一個如何調兵遣將的問題。
展開 APDL Showcase1的理論基礎(3)——模態提取方法簡介
差異主要發生在模型非常大(大到需要使用迭代求解器)、以及要求的模態非常多(超過100階,甚至10,000階)時。
簡單說來,40階以下,模型沒有大到需要在靜力分析中使用迭代求解器,那么使用默認的Block Lanczos就好;
如果你的模型在靜力分析中會選擇使用PCG(預條件的共軛梯度法)迭代求解器,而且你模型的單元質量還說得過去,那模態求解的時候就用迭代法PCG Lanczos,能省不少磁盤空間;
如果你要求比較高,需要100階以上的模態,那么Supernode方法適合你。最高可以找到10,000階說的就是它;
如果質量矩陣部分為零,或者包含混合單元(u-P單元),再或者需要使用分布式ANSYS求解器的時候,可以選擇Subspace方法。
——行,一圈看下來,普通小打小鬧研究個6階模態或者十幾二十階模態的,都用默認就好了唄。
區分這幾個求解器的主要指標:
要求解的模態,小于100就前兩個,多于100階就Supernode;
模型的網格質量比較好,網格數特別多,就用迭代求解器;
包含混合列式單元,或者分布式求解器(一般單機多核不算)的時候用Subspace。
話說,通常需要尋找非常多(超過100階)模態的原因主要是為后續的模態疊加和PSD分析做準備,來求解高頻激勵下結構的響應。這個Supernode算法會有一些誤差,但大部分時候都在1%以內,是工程上完全可以接受的精度。
3. 阻尼法和非對稱求解器
把這倆放一起講,主要是因為它倆經過變換其實是一回事。
你看這個包含阻尼的問題,它要求解的是這么個東西:
這里[C]是阻尼矩陣。但它其實使用了和UNSYM,非對稱求解器幾乎一樣的算法。
展開 光通信設計軟件——OptiFDTD 有限差分時域仿真設計軟件
OptiFDTD能夠在使用共享內存的單機上高效運行多核和多處理器,提供最佳性能和最低內存占用(相比于諸如MPI的分布式存儲架構)。對于需要大量內存的超規模仿真,用戶可以使用我們的Linux的3D仿真引擎,該引擎經專門設計可利用Linux計算機集群。
先進的仿真后處理工具
OptiFDTD提供先進的模擬分析工具。OptiFDTD分析儀可以讓用戶觀察由探測器記錄的任何場成分的時域和頻域(使用DFT變換)振幅,相位。所有的場數據可以輸出用于諸如MATLAB?或Origin?等第三方軟件工具用于進一步數據處理。
時域場的演變也可以以影像(avi格式)的形式記錄下來進行可視化。功率分布、坡印廷矢量、重疊積分、熱吸收計算和遠場計算可以使用OptiFDTD分析儀和OptiFDTD工具箱完成。
展開 2023年MATLAB科學計算工作站及集群配置方案
早期我們對MatLAB全部應用工具箱計算特點進行了總結歸類,
詳見 https://www.xasun.com/article/fb/2433.html
今天我們提供多種不同計算架構,保證每一個計算應用對應配置達到理想的最高性能能力,四類硬件配置:
(1)純CPU計算---MatLAB高頻科學計算工作站配置推薦
(2)基于GPU加速---MatLAB 異構超算工作站配置推薦
(3)基于實時計算---MatLAB實時采集與數據計算分析硬件配置方案
(4)基于多機集群---MatLAB多機分布式集群計算配置方案(待續)
1.1 MatLAB高頻科學計算工作站硬件配置推薦
應用定位:滿足極致單核CPU計算或超大規模的多核CPU性能要求
技術特點:基于純CPU計算應用,CPU超頻或高頻,保證單核或多核計算能力達到極致。
展開 工業軟件研發中處理超大模型(6)--有限元求解器
常見例子,某些大線性方程組求解在節點達到一定數目后,其加速比呈下降趨勢,原因在節點多到一定程度后,分治數據之間的通信開銷開始成為性能瓶頸。
3.單機并行
在單機上,CPU多核已經非常普遍,利用多線程,多進程可以輕松做到在不同CPU核上并行計算。而單機的線程工具已經非常普及,比如OpneMP,C++11新增線程類,QT提供的線程進程操作工具。對于類似共享內存式并行,網絡以及通信開銷可以忽略不計。
4.指令優化
單指令流多數據流機器(SIMD)
SIMD是采用一個指令流處理多個數據流。這類機器在數字信號處理、圖像處理、以及多媒體信息處理等領域非常有效。
Intel處理器實現的MMXTM、SSE(Streaming SIMD Extensions)、SSE2及SSE3擴展指令集,都能在單個時鐘周期內處理多個數據單元。也就是說我們現在用的單核計算機基本上都屬于SIMD機器。
多指令流多數據流機器(MIMD)
MIMD機器可以同時執行多個指令流,這些指令流分別對不同數據流進行操作。最新的多核計算平臺就屬于MIMD的范疇,例如Intel和AMD的雙核處理器等都屬于MIMD。
指令優化主要針對具體硬件的指令支持情況,程序中合理使用指令集,計算可以起到很好的加速效果。
5.異構架構式并行
DPU(Data Processing Unit)是以數據為中心構造的專用處理器,采用軟件定義技術路線支撐基礎設施層資源虛擬化,支持存儲、安全、服務質量管理等基礎設施層服務。2020年NVIDIA公司發布的DPU產品戰略中將其定位為數據中 心繼CPU和GPU之后的“第三顆主力芯片”,掀起了一波行業熱潮。DPU的出 現是異構計算的一個階段性標志。
展開 