
發(fā)布
注冊
/
登錄并行計算的案例
2005高性能計算應(yīng)用大會---并行計算
2005高性能計算應(yīng)用大會---并行計算
2005高性能計算應(yīng)用大會---并行計算.part1.rar
2005高性能計算應(yīng)用大會---并行計算.part2.rar
2005高性能計算應(yīng)用大會---并行計算.part3.rar
2005高性能計算應(yīng)用大會---并行計算.part4.rar
2005高性能計算應(yīng)用大會---并行計算.part5.rar
2005高性能計算應(yīng)用大會---并行計算.part6.rar
展開 有限元結(jié)構(gòu)分析并行計算
有限元結(jié)構(gòu)分析并行計算.part1
有限元結(jié)構(gòu)分析并行計算.part1.rar
有限元結(jié)構(gòu)分析并行計算.part2.rar
有限元結(jié)構(gòu)分析并行計算.part3.rar
有限元結(jié)構(gòu)分析并行計算.part4.rar
有限元結(jié)構(gòu)分析并行計算.part5.rar
有限元結(jié)構(gòu)分析并行計算.part6.rar
有限元結(jié)構(gòu)分析并行計算.part0492.rar
有限元結(jié)構(gòu)分析并行計算.part0493.rar
有限元結(jié)構(gòu)分析并行計算.part0494.rar
展開 Mathematica 的并行計算
只要您使用其中一個并行命令(例如并行計算表的元素),Mathematica 就會在每個內(nèi)核上啟動一個額外的內(nèi)核并分配工作。為了讓自己相信計算確實發(fā)生在這些額外的內(nèi)核上,我們可以要求一個計算來告訴我們每個元素的計算位置。
每個正在運行的內(nèi)核都有一個唯一的 ID 值,可以幫助調(diào)度更復(fù)雜的分布式算法。
本周 (2009/3/18) 發(fā)布的 gridMathematica Server (https://wolfr.am/10mM353BQ) 是邁向無障礙并行計算的又一重要步驟。在早期,人們必須收集網(wǎng)絡(luò)中所有可用機器的主機名,并使用遠程登錄技術(shù)在這些機器上啟動 Mathematica。如今,您網(wǎng)絡(luò)上的 gridMathematica 安裝將自我宣傳,就像您的打印機、多媒體播放器和其他共享資源一樣。
可用的機器將顯示在控制面板中,您只需選擇要使用的機器即可。在這里,我的小網(wǎng)絡(luò)由兩臺雙核機器組成,其中一臺可用。
現(xiàn)在,我總共有六個內(nèi)核可用。
Mathematica 也是分析并行計算性能的最佳工具。在這里,我們測量了兩個遠程內(nèi)核的基本延遲。延遲只是簡單計算的往返時間。
并非所有計算都受益于并行化。例如,內(nèi)核計算 Sin[1.0] 所花費的時間比將這個命令發(fā)送到另一個內(nèi)核并接收結(jié)果所花費的時間要少。
新的并行狀態(tài)窗口使用動態(tài)更新來顯示每次并行計算后的基本性能數(shù)據(jù)。它可以讓您一目了然地看到調(diào)度對不均勻問題的影響。在第一次運行中,我們將一系列素性測試單獨安排到兩個可用的內(nèi)核上。從狀態(tài)窗口的快照可以看出,這兩個內(nèi)核都執(zhí)行了相當(dāng)一部分工作。
現(xiàn)在我們預(yù)先在每個內(nèi)核上安排一半的測試。
展開 Simcenter STAR-CCM+ 并行計算性能
針對CFD求解計算量大、計算效率低下的問題,提出了從實現(xiàn)方法上和理論上兩種加速方案。從實現(xiàn)方法上講,采用基于C語言的GPU并行計算方法代替?zhèn)鹘y(tǒng)的CPU串行計算方法。GPU并行計算方法相比于傳統(tǒng)的CPU串行方法有著一定倍數(shù)的加速比,可以提高效率縮短計算時間。將GPU并行計算方法和基于系統(tǒng)識別的ROM方法相結(jié)合,可以得到更可觀的加速效果。
高精度混合網(wǎng)格并行計算軟件在采用千萬網(wǎng)格點規(guī)模的復(fù)雜流場計算時,不僅計算結(jié)果與實驗結(jié)果符合較好,且512至2048核并行計算時仍具有很好的并行可擴展性,計算效率不低于80%。
展開 
lsdyna mpp for Windows-實現(xiàn)LS-DYNA單機多核MPP并行計算交互界面軟件 ¥99
看到很多同行疑問如何在獨立版LS-Dyna-MPP求解器中實現(xiàn)并行計算,在此提供大家一個提交并行計算的GUI交互軟件(配合mpi軟件),方便大家實現(xiàn)LS-Dyna-MPP并行求解計算,僅供大家學(xué)習(xí)交流,提升工作效率。
純技術(shù)干貨,dyna-mpi-mpp資料打包在一起,一站式購買安裝即可使用,值得珍藏擁有。
收費內(nèi)容主要包括:
1)lsdyan-mpp軟件下載及安裝,含設(shè)置dyna環(huán)境變量
2)Mpi軟件及環(huán)境變量設(shè)置
3)一款可實現(xiàn)dyna-mpp并行計算的交互軟件
4)各軟件主要的安裝步驟及環(huán)境變量設(shè)置,僅供個人學(xué)習(xí)和實現(xiàn)dyna單臺電腦實現(xiàn)mpp并行計算,切勿商用。
備注:實用資料供愛好學(xué)習(xí)的你,記得關(guān)注并點贊哦。
收費內(nèi)容主要包括:
1)lsdyan-mpp軟件下載及安裝,含設(shè)置dyna環(huán)境變量
2)MPI軟件及環(huán)境變量設(shè)置
3)一款可實現(xiàn)dyna-mpp并行計算的交互軟件
4)各軟件主要的安裝步驟及環(huán)境變量設(shè)置,僅供個人學(xué)習(xí)和實現(xiàn)dyna單臺電腦實現(xiàn)mpp并行計算,切勿商用。
備注:實用資料供愛好學(xué)習(xí)的你,記得關(guān)注并點贊哦。
展開 isight分布并行高性能計算能力
分布并行高性能計算能力是isght軟件的一個重要而突出的性能。
一.什么是分布并行呢?
分布:iSIGHT可以通過任務(wù)管理器與其它計算機運行的各種應(yīng)用軟件相連接,對輸入輸出文件的處理及軟件的啟動和監(jiān)視進行遙控作業(yè),以便運行分布在多計算機、多操作系統(tǒng)和多領(lǐng)域之間的目標(biāo)優(yōu)化問題,適用于客戶的各種計算環(huán)境。
并行:iSIGHTtigong分布并行模式,使用戶能夠有效合理的利用硬件資源,對復(fù)雜耗時的優(yōu)化任務(wù)進行多機分布并行計算,并且用戶可以通過圖形界面總覽當(dāng)前網(wǎng)絡(luò)環(huán)境,并根據(jù)計算機類型或工作組特性進行任務(wù)分派。
二.為什么要進行并行計算呢?
在進行多模塊多因子項目分析時,通常計算量較大,且模塊間關(guān)系較復(fù)雜,計算起來可能消耗較長的時間。
為了應(yīng)對這種情況,Isighttigong分布并行模式,使用戶能夠有效合理的利用硬件資源。對復(fù)雜耗時的優(yōu)化任務(wù)進行多機分布并行計算,并且用戶可以通過圖形界面總覽當(dāng)前網(wǎng)絡(luò)環(huán)境,并根據(jù)計算機類型或工作組特性進行任務(wù)分派。
三.分布并行具體包括哪些內(nèi)容呢?
1.任務(wù)并行計算
可以根據(jù)計算機資源和機器的工作特性(是否裝載某仿真軟件)來合理的將優(yōu)化任務(wù)中的某個組件或子任務(wù)分配給合適的計算機進行計算。
分布并行高性能計算能力.pdf
展開 一文讀懂Fluent并行計算,三大技術(shù)提升計算效率新境界!
隨著技術(shù)的不斷進步,Ansys工程師們致力于優(yōu)化底層的并行算法,以提升其計算性能,使用戶體驗飛一般的計算速度。
在Ansys Fluent中,盡管工程師已經(jīng)針對并行算法進行了充分優(yōu)化,但在實際應(yīng)用中,還有其他方法可以進一步提高計算性能。本文闡述了Fluent并行計算的基本原理,同時探討通過AVX2指令集加速、GPU加速以及超線程等技術(shù)手段來提高計算效率。
01 什么是Fluent并行計算
Fluent的并行求解器通過協(xié)同運作多個進程來計算大型問題,這些進程既可以在同一臺機器上運行,也可以在網(wǎng)絡(luò)中的不同設(shè)備上運行。
并行求解器將計算域分為多個區(qū)域(圖1),將各數(shù)據(jù)分區(qū)分配至不同的計算進程(稱為計算節(jié)點,圖2),每個計算節(jié)點都在其專屬數(shù)據(jù)集上同步執(zhí)行同一程序。主進程(或稱為主機)不包含網(wǎng)格單元、面或節(jié)點(除非使用 DPM 共享內(nèi)存模型),其主要職責(zé)是解析 Cortex(負責(zé)用戶界面和圖形相關(guān)功能的 Fluent 進程)發(fā)送的指令,并將這些指令(及數(shù)據(jù))傳遞給某一計算進程,再由該計算進程將其分發(fā)至其他計算進程。
圖1:計算區(qū)域分區(qū)
圖2:分區(qū)網(wǎng)格邊界
計算節(jié)點負責(zé)存儲并執(zhí)行部分網(wǎng)格的計算任務(wù),而位于分區(qū)邊界的單層重疊單元格層則負責(zé)跨分區(qū)邊界的通信(圖2)。盡管單元格和面被分割,但網(wǎng)格中的所有域和線程在每個計算節(jié)點上均存在鏡像(圖3)。線程以鏈接列表的形式存儲,和串行求解器保持一致。計算節(jié)點可在大規(guī)模并行計算機、多CPU 工作站或具備相同或多工作站組成的網(wǎng)絡(luò) 上實現(xiàn)。 [1]
圖3:分布式網(wǎng)格中的域和線程鏡像
命令傳輸和通信
在Flunet并行計算會話中,進程涉及的主體包括 Cortex(主機進程)和一組 n 個計算節(jié)點進程,這些計算節(jié)點由 0 到 n-1 進行標(biāo)記(圖4)。
展開 Moldex3D模流分析之高效多核與并行計算技術(shù)
然而,三維模流分析在完全不簡化模型的情況下,無可避免增加了許多計算上的負擔(dān),使得計算時間增長。Moldex3D所采用的高效能有限體積法 (HPFVM, High-Performance Finite Volume Method),雖然已經(jīng)是目前商用CAE軟件中計算效能高的一種,但是當(dāng)面臨大型模具,以及客戶快速分析的期望時,仍有相當(dāng)大的改進空間。
Moldex3D 在業(yè)界率先支持并行計算,以求大量增進分析計算效能,在更短時間內(nèi)完成復(fù)雜、內(nèi)含大量網(wǎng)格元素的模型分析數(shù)據(jù)。高效率的平行化計算核心可進行完整的充填、保壓、冷卻、翹曲、玻纖排向、反應(yīng)射出…等計算。此外,Moldex3D 并行計算技術(shù)可同時支持多CPU和叢集式計算機計算。
對于光學(xué)零件,纖維補強汽車零組件、連接器、齒輪..等等,對高精度和高速計算的需求永遠不能低估。計算速度可以被更新更強大的CPU改善。然而,僅僅改進CPU的速度在速度和準(zhǔn)確性上并無法滿足工業(yè)用戶。多核心CPU計算機組成的使用,便成為可行的解決方案。
效能顯著的案例探討
Moldex3D身為CAE專業(yè)廠商,是市面上能完整支持全并行計算的模流軟件,包含流動、保壓、冷卻、翹曲、纖維、多材質(zhì)射出等分析。運用多核心或者多CPU的高計算能力,計算時間能受大幅的縮短,例如以雙核心的計算機為例,計算效率有機會提升50%到80%以上。Moldex3D高效多核與并行計算技術(shù)能降低您的成本并產(chǎn)生極高的效益。
展開 TOSCA并行計算中的設(shè)置問題
TOSCA具有并行計算與多處理器求解的功能,這樣就可以實現(xiàn)對大型模型的優(yōu)化計算。
一、并行設(shè)置
為了實現(xiàn)并行計算的功能,需要進行相應(yīng)的設(shè)置。打開TOSCA安裝目錄“\SIMULIA\Tosca8.0\bin”里面的一個tosca_ctrl.cfg配置文件,使用文本格式打開后搜索相應(yīng)的求解器,里面可以設(shè)置多種求解器的設(shè)置。此處假如設(shè)置的求解器是abaqus,設(shè)置如下語句:${fe_solver_exe} = "";引號內(nèi)輸入添加求解器命令,如下圖所示:
圖太多,大家要看的話看附件吧~
TOSCA并行計算中的設(shè)置問題.pdf
展開 simufact并行計算設(shè)置
分享一下Simufact并行計算的設(shè)置,今天翻帖子才發(fā)現(xiàn)有網(wǎng)友問過這個問題,嘿嘿嘿,我就介紹一下我的經(jīng)驗吧。
Simufact提供的并行計算方式和大多數(shù)軟件的類似,說說我用過的其中一種吧。
單機多CPU的設(shè)置,這應(yīng)該也是目前為廣大網(wǎng)友用的最廣泛的一種了。如下圖為用4個CPU并行計算的設(shè)置,下面的for workpiece only意思是這四個CPU對坯料進行分區(qū)計算
這個與MSC.marc和msc.superform的單機多CPU并行使一個道理,就是把坯料網(wǎng)格劃分為不同區(qū)域,每一個區(qū)域?qū)?yīng)一個CPU進行計算的,如下圖所示。
for multiple bodies一般用多個變形體上面,比如要對模具劃分網(wǎng)格進行分析的時候,這樣就是一個體對應(yīng)一個CPU進行計算了,如下圖所示。
展開 Moldex3D模流分析之并行計算架構(gòu)
Moldex3D Linux 并行計算架構(gòu)
?Linux節(jié)點叢集
先決條件:
1.例如:你的賬號是peter ,你有你的主目錄: /home/peter。
2.//home/peter 是網(wǎng)絡(luò)共享的,因此所有加入并行計算的節(jié)點都可以存取 /home/peter。 (這是NFS提供的功能。)
3.您(peter)可以透過SSH登入所有加入并行計算的節(jié)點,無需輸入密碼。 (這是NIS和SSH提供的功能。)
4.所有節(jié)點都知道其他節(jié)點的IP和主機名的映像。 (這是DNS提供的功能。)
5.計算節(jié)點需要連接到Windows授權(quán)節(jié)點以獲取授權(quán)。
?只有 1 個 Linux 節(jié)點
先決條件:
?例如:你的賬號是peter ,你有你的主目錄: /home/peter。
?Linux 操作系統(tǒng)的必備條件
Moldex3D 2024 支持的 Linux 版本
?CentO Linux 7或8系列 (64位)
?Rocky Linux 8系列 (64位)
?RHEL (Red Hat Enterprise Linux) 7或8系列 (64位)
展開 
電子散熱分析軟件并行計算功能教程
本視頻是電子散熱分析軟件FloTHERM的并行計算功能的介紹和詳細的使用教程。FloTHERM軟件是Mentor Graphics Mechanical Analysis部門于1988年推出的專業(yè)于電子散熱分析的軟件,市場占有率70%。
該視頻為中文錄音,配備操作視頻,非常值得正在使用FloTHERM軟件的用戶學(xué)習(xí)進一步嫻熟的使用并行計算的功能,利用它減少工作量,節(jié)省時間。
視頻為介紹部分,如果希望學(xué)習(xí)并行計算功能,請和Mentor Graphics Mechanical Analysis部門 中國辦事處聯(lián)系獲取完整的教程。
如果不能播放,請直接點擊鏈接觀看http://www.tudou.com/programs/view/lNthxklV7q4/
Flash:FloTHERM Command Center功能學(xué)習(xí)教程
展開 適用于Ls_Dyna提交排隊計算和并行計算的windows批處理命令
i=D:\Data\CAE_Model\Rav4\Rav4_01.k代表需要提交計算的.k文件。ncpu=8代表此項計算任務(wù)將占用CPU資源為8個線程(此項根據(jù)具體情況設(shè)置。若未非正版Ls_Dyna,一般此項設(shè)置為8;若為正版Ls_Dyna,此項根據(jù)計算機可分配計算資源,可設(shè)置為8/16/32)。
memory=1000m代表此項計算任務(wù)將占用內(nèi)存為1000M(一般此項設(shè)置為1000M或2000M)。
pause(意為停止)代表所有計算停止。
一個cd后面直到下一個cd出現(xiàn)之前的命令為一個計算任務(wù)的執(zhí)行命令。
若計算機計算資源充足,可以進行并行計算時,可以使用windows并行計算命令實現(xiàn),具體方法如下:
將需要排隊計算的任務(wù)編寫成windows批處理文件(方法如上),例如assignment01.bat和assignment02.bat
新建.txt文件/輸入以下命令/保存/更改文件格式為.bat文件/雙擊文件
@echo off
start D:\Data\CAE_Model\assignment01.bat
start D:\Data\CAE_Model\assignment02.bat
pause
注意命令中的空格符
附:windows批量排隊并行計算軟件job Submitter,該軟件集成于PreSys中
展開 ANSYS Workbench并行計算及其他基礎(chǔ)設(shè)置教程 ¥1
3.并行計算設(shè)置:數(shù)值模擬常常是大規(guī)模的科學(xué)計算,一般依靠CPU浮點計算能力進行偏微分方程的求解(直接求解法的話更依賴于內(nèi)存),使用多核心并行計算的方式可以提高計算性能。但是在使用前,必須進行相關(guān)的設(shè)置:
Tools-solution process-Default execution Mode,默認是serial(串行),下拉即可選擇Parallel(并行),雖然此時已經(jīng)開啟了并行計算,但是軟件默認的可并行核心數(shù)為2,因此需要更改相應(yīng)核數(shù),在并行串行計算設(shè)置下方可輸入核數(shù),并且在solution process下方的Mechanical APDL中,processors中可以設(shè)置相應(yīng)核數(shù)。一般可設(shè)為20核,此處設(shè)置的核心數(shù)如果超過了計算機實際的物理核心,求解時會發(fā)生警告,但不影響計算。
最后要注意的是,軟件可以調(diào)用的實際核數(shù),不僅與硬件相關(guān),而且與許可證允許的最大核數(shù)相關(guān),一般許可證允許8個物理核心,所以軟件實際可調(diào)用的最大核心數(shù)量在計算機物理核心和軟件許可證允許核心數(shù)兩者中去較小值。
4.工作空間設(shè)置:當(dāng)求解所需內(nèi)存超過計算機實際內(nèi)存時,索要的磁盤空間可能會很大,因此需要設(shè)置一個較大的工作空間,否則軟件會報錯推出。
單擊Mechanical APDL,將Database Memory(數(shù)據(jù)庫空間)從默認值調(diào)小,最小32MB,最大64MB,將Workspace Memory(演算空間)的默認值調(diào)大。
基本設(shè)置如上
展開 LMS Virtual.Lab Motion_視頻教程4之如何設(shè)置并行計算
最近發(fā)現(xiàn)有些網(wǎng)友在討論如何進行并行計算,今天發(fā)一個Motion里面并行計算設(shè)置的視頻教程。就是HELP文檔里面的設(shè)置,視頻里面有詳細的操作,希望對大家有用。
視頻地址:http://pan.baidu.com/s/1eQsw7Uq 曾春發(fā)帖資料 --> LMS Virtual.Lab Motion視頻教程04之并行計算設(shè)置.rar
更多資料請關(guān)注百度網(wǎng)盤LMS_VL_Motion,Moiton交流群:324201728;Motion汽車模塊交流群:264418240;Durability交流群:83853780
展開