發布

單機多核的案例

Optistruct實現單機多核mpp計算方法￥5

Optistruct實現單機多核mpp計算方法

lsdyna mpp for Windows-實現LS-DYNA單機多核MPP并行計算交互界面軟件￥99

看到很多同行疑問如何在獨立版LS-Dyna-MPP求解器中實現并行計算，在此提供大家一個提交并行計算的GUI交互軟件（配合mpi軟件），方便大家實現LS-Dyna-MPP并行求解計算，僅供大家學習交流，提升工作效率。純技術干貨，dyna-mpi-mpp資料打包在一起，一站式購買安裝即可使用，值得珍藏擁有。收費內容主要包括： 1）lsdyan-mpp軟件下載及安裝，含設置dyna環境變量 2）Mpi軟件及環境變量設置 3）一款可實現dyna-mpp并行計算的交互軟件 4）各軟件主要的安裝步驟及環境變量設置，僅供個人學習和實現dyna單臺電腦實現mpp并行計算，切勿商用。備注：實用資料供愛好學習的你，記得關注并點贊哦。收費內容主要包括： 1）lsdyan-mpp軟件下載及安裝，含設置dyna環境變量 2）MPI軟件及環境變量設置 3）一款可實現dyna-mpp并行計算的交互軟件 4）各軟件主要的安裝步驟及環境變量設置，僅供個人學習和實現dyna單臺電腦實現mpp并行計算，切勿商用。備注：實用資料供愛好學習的你，記得關注并點贊哦。

展開

用個小招數解決ANSYS運行內存不夠的問題

4.CPU設置方面，選用CPU的數量為物理核心-1，為系統留一個核心，以免死機就行，原則上核心用的越多，就用越多的系統資源來計算，效果越好。至于設置的方法，存在兩種模式：SMP和MPP. SMP Shared-Memory parallel 共享內存，適用于單機多核并行(針對于本機) 特點: 1) 超過2個處理器(核)后，每個處理器(核)都需要一個HPC licenses (High Performance computing)，一個HPC licenses可以支持兩個處理器(核)，比如4個處理器或兩個雙核的處理器，需要2個HPC licenses 2) 物理內存連續，即所有即將使用的處理器共用一個物理內存，比如dual或者quad cores 的處理器適用于: 1)大多數，并不是全部的/Solu過程可以并行 2)適用于/solu中的較多的求解器。

展開

LS_DYNA-MPP 多核并行計算資料分享

另外需要lsdyna-mpp個人電腦實現單機多核mpp并行計算軟件的請在https://www.yqgqt.org.cn/content/post/541092 鏈接中下載試用。

【轉】fluent中隱藏模型的開啟

以下為部分隱藏模型的開啟方法： 1.并行模式（僅適用于單機多核情況）在windows“開始/運行”中輸入“fluent 2d -t2”，其中“2d”表示2d求解器，"t2"表示用兩個核心進行并行計算。需要注意的是，有的機器需要在“開始/運行”中輸入fluent的完整路徑，比如“C:\Fluent.Inc\ntbin\ntx86\fluent 2d -t2”。 2.大渦模擬在fluent界面中輸入命令“（rpsetvar 'les-2d? #t)”，然后按回車就行了。需要注意的是括號不能少，另外好像是需要手動輸入的，直接粘貼的話有可能不行。 3.低雷諾數模型（高版本的fluent中不需要TUI設置了）首先選中k-e模型，然后在fluent界面中輸入“de/mo/v/t”，回車。此時會出現三個模型選項，然后輸入“low"，回車，輸入“y”，回車。這樣你在k-e模型下就發現多了個低雷諾數選項。另外兩個專家模型，大家有興趣的話也可以研究一下。 4.電磁流體模型讀入你的case，然后在fluent界面中輸入“de/mo/add”，回車，此時出現5個隱藏模型選項，選擇第一個就是mhd模型了。需要注意的是只有先讀入cas之后，才能調出該模型。 5.網格修補 fluent讀入網格時，特別是針對gridgen等第三方網格，有的時候會出現left handness的情況。在fluent界面中輸入“gr/mo/re-fa-ha”，回車。據說進行上述操作之后就有可能修復left handness的問題。（不過我一次都沒修復成功過）。

展開

巖土工程有限元軟件及其發展趨勢

08 從單機單核CPU計算到單機多核CPU，多機CPU并行，CPU-GPU混合并行和云計算數值模擬分析軟件也應該順應計算機硬件技術的快速發展。目前，個人計算機已經從單機單核像單機多核發展。對于高性能計算，還需要多機并行處理。這使得依賴于計算機硬件的軟件系統必須適應硬件的發展，達到更加有效地進行數值模擬和計算。例如，ABAQUS在生成任務時會選擇使用幾個CPU來進行計算，ANSYS也提供了分布式并行計算功能。ABAQUS可以使用單機多核(CPU)技術。未來還要向多機多核并行計算發展。近年來，計算圖形處理器（GPU-Graphics Processing Units）技術發展迅速，其應用范圍已經從單一的圖形處理擴展到通用數值計算。由于GPU具有流處理、可編程流水線和高密度并行處理能力，與CPU 相比，GPU具有更強的浮點運算能力，通常擁有一個或更高數量級的浮點運算速度。由于具有高性價比和低功耗等優點，GPU已經成為高性能通用計算的一種選擇。由于GPU在高強度浮點計算方面具有獨特的優勢，采用CPU-GPU混合計算來求解一個問題也可能成為未來有限元計算的一個趨勢。云計算是一種新興的資源使用和交付模式，通過交付和支付的方式有效利用互聯網分布式計算資源和計算能力，它是一種區別于網格計算、效用計算、自主計算的一種新型計算模式。

展開

【白話IC】揭秘20000個VCS任務背后的“搬桌子”系列故事

我們看看從第一階段到第二階段的實際VCS驗證效果：應用并行化驗證 400個任務對VCS進行多任務并行化處理后，一臺單機運行相同VCS任務的時間縮短為原先的15%-16%，極大提升了運行效率。實證過程： 1、使用一臺單機C1（8核）運行400個VCS任務，耗時806分鐘； 2、使用一臺單機C2（8核）運行400個VCS任務，耗時793分鐘； 3、對VCS應用進行多任務并行化處理后，使用一臺單機C1（8核）運行400個VCS任務，耗時130分鐘； 4、對VCS應用進行多任務并行化處理后，使用一臺單機C2（8核）運行400個VCS任務，耗時122分鐘。第三階段：多機多CPU核，多任務多任務狀態下的多機多核，就是多個任務能同時在數臺機器的數個CPU上跑，這個我們稱之為集群化管理，一般都需要有調度器的參與。關于調度器的相關知識，看這里：億萬打工人的夢：16萬個CPU隨你用前面講到我們已經可以同時安排搬兩張桌子啦。但其實，如果你的機器足夠多，人（CPU核）足夠多，你完全可以同時搬更多的桌子。這個時候，必然要面臨一個如何調兵遣將的問題。

展開

APDL Showcase1的理論基礎(3)——模態提取方法簡介

差異主要發生在模型非常大(大到需要使用迭代求解器)、以及要求的模態非常多（超過100階，甚至10,000階）時。簡單說來，40階以下，模型沒有大到需要在靜力分析中使用迭代求解器，那么使用默認的Block Lanczos就好；如果你的模型在靜力分析中會選擇使用PCG（預條件的共軛梯度法）迭代求解器，而且你模型的單元質量還說得過去，那模態求解的時候就用迭代法PCG Lanczos，能省不少磁盤空間；如果你要求比較高，需要100階以上的模態，那么Supernode方法適合你。最高可以找到10,000階說的就是它；如果質量矩陣部分為零，或者包含混合單元（u-P單元），再或者需要使用分布式ANSYS求解器的時候，可以選擇Subspace方法。 ——行，一圈看下來，普通小打小鬧研究個6階模態或者十幾二十階模態的，都用默認就好了唄。區分這幾個求解器的主要指標：要求解的模態，小于100就前兩個，多于100階就Supernode；模型的網格質量比較好，網格數特別多，就用迭代求解器；包含混合列式單元，或者分布式求解器（一般單機多核不算）的時候用Subspace。話說，通常需要尋找非常多（超過100階）模態的原因主要是為后續的模態疊加和PSD分析做準備，來求解高頻激勵下結構的響應。這個Supernode算法會有一些誤差，但大部分時候都在1%以內，是工程上完全可以接受的精度。 3. 阻尼法和非對稱求解器把這倆放一起講，主要是因為它倆經過變換其實是一回事。你看這個包含阻尼的問題，它要求解的是這么個東西：這里[C]是阻尼矩陣。但它其實使用了和UNSYM，非對稱求解器幾乎一樣的算法。

展開

光通信設計軟件——OptiFDTD 有限差分時域仿真設計軟件

OptiFDTD能夠在使用共享內存的單機上高效運行多核和多處理器，提供最佳性能和最低內存占用（相比于諸如MPI的分布式存儲架構）。對于需要大量內存的超規模仿真，用戶可以使用我們的Linux的3D仿真引擎，該引擎經專門設計可利用Linux計算機集群。先進的仿真后處理工具 OptiFDTD提供先進的模擬分析工具。OptiFDTD分析儀可以讓用戶觀察由探測器記錄的任何場成分的時域和頻域（使用DFT變換）振幅，相位。所有的場數據可以輸出用于諸如MATLAB?或Origin?等第三方軟件工具用于進一步數據處理。時域場的演變也可以以影像（avi格式）的形式記錄下來進行可視化。功率分布、坡印廷矢量、重疊積分、熱吸收計算和遠場計算可以使用OptiFDTD分析儀和OptiFDTD工具箱完成。

展開

2023年MATLAB科學計算工作站及集群配置方案

早期我們對MatLAB全部應用工具箱計算特點進行了總結歸類，詳見 https://www.xasun.com/article/fb/2433.html 今天我們提供多種不同計算架構，保證每一個計算應用對應配置達到理想的最高性能能力，四類硬件配置：（1）純CPU計算---MatLAB高頻科學計算工作站配置推薦（2）基于GPU加速---MatLAB 異構超算工作站配置推薦（3）基于實時計算---MatLAB實時采集與數據計算分析硬件配置方案（4）基于多機集群---MatLAB多機分布式集群計算配置方案（待續） 1.1 MatLAB高頻科學計算工作站硬件配置推薦應用定位：滿足極致單核CPU計算或超大規模的多核CPU性能要求技術特點：基于純CPU計算應用，CPU超頻或高頻，保證單核或多核計算能力達到極致。

展開

工業軟件研發中處理超大模型(6)--有限元求解器

常見例子，某些大線性方程組求解在節點達到一定數目后，其加速比呈下降趨勢，原因在節點多到一定程度后，分治數據之間的通信開銷開始成為性能瓶頸。 3.單機并行在單機上，CPU多核已經非常普遍，利用多線程，多進程可以輕松做到在不同CPU核上并行計算。而單機的線程工具已經非常普及，比如OpneMP，C++11新增線程類，QT提供的線程進程操作工具。對于類似共享內存式并行，網絡以及通信開銷可以忽略不計。 4.指令優化單指令流多數據流機器（SIMD） SIMD是采用一個指令流處理多個數據流。這類機器在數字信號處理、圖像處理、以及多媒體信息處理等領域非常有效。 Intel處理器實現的MMXTM、SSE（Streaming SIMD Extensions）、SSE2及SSE3擴展指令集，都能在單個時鐘周期內處理多個數據單元。也就是說我們現在用的單核計算機基本上都屬于SIMD機器。多指令流多數據流機器（MIMD） MIMD機器可以同時執行多個指令流，這些指令流分別對不同數據流進行操作。最新的多核計算平臺就屬于MIMD的范疇，例如Intel和AMD的雙核處理器等都屬于MIMD。指令優化主要針對具體硬件的指令支持情況，程序中合理使用指令集，計算可以起到很好的加速效果。 5.異構架構式并行 DPU（Data Processing Unit）是以數據為中心構造的專用處理器，采用軟件定義技術路線支撐基礎設施層資源虛擬化，支持存儲、安全、服務質量管理等基礎設施層服務。2020年NVIDIA公司發布的DPU產品戰略中將其定位為數據中心繼CPU和GPU之后的“第三顆主力芯片”，掀起了一波行業熱潮。DPU的出現是異構計算的一個階段性標志。

展開

共11條

首頁 1 尾頁 , 到第頁

不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

單機多核的案例

單機多核的相關專題、標簽、搜索