
發(fā)布
注冊
/
登錄顯卡
關注創(chuàng)建者:jiqian4165 創(chuàng)建時間:2018-08-21
顯卡的視頻教程
【軟件教程】云端CAE實戰(zhàn)——StarCCM+ 顯卡冷卻模擬分析
前處理→求解→后處理,1個視頻, 用“顯卡冷卻模擬分析”, 帶您從0開啟全流程高性能仿真云端實戰(zhàn)!
免費 18分鐘 2播放
查看
II-02多零部件固體:顯卡冷卻《STAR CCM+官方案例視頻教程》
STAR CCM+官方案例視頻教程系列之II熱傳遞和輻射_02多零部件固體:顯卡冷卻 涉及主要知識點: 1)已知風扇性能曲線,創(chuàng)建風扇交界面; 2)多個固體和多個流體網(wǎng)格和區(qū)域創(chuàng)建; 3)設置熱源。
免費 31分鐘 445播放
查看
STARCCM+系列CFD課程05-熱傳遞與輻射
課程安排: <01> 傳熱與輻射概述 <02> 共軛熱傳遞-加熱翼片導入 <03> 排氣歧管模擬操作-多時間尺度共軛傳熱 <04> 排氣歧管-瞬態(tài)-瞬態(tài)多時間尺度共軛傳熱 <05> 多零部件固體-顯卡冷卻 <06> 自然對流-
¥180 11小時30分鐘 332播放
查看
顯卡的實例教程
我們發(fā)現(xiàn),部分場景下 NCSIMUL 會被配置為使用計算機的處理器集成顯卡(而非獨立顯卡),這會對顯示效果和仿真性能造成顯著影響。NCSIMUL 2025.4 新增了一套系統(tǒng)檢測機制,可識別軟件是否正在使用計算機的獨立顯卡。
如今,當 NCSIMUL 檢測到當前使用的顯卡不符合適配要求時,會在仿真過程中彈出警告提示。接下來我們看一下如何發(fā)現(xiàn)此類問題,并通過哪些方法解決。
一
電腦通常默認的顯卡配置
?通常情況下我們的顯卡配置中,圖像設置會選擇由3D應用程序決定。所有的設置都采用自動選擇的方式。如下圖:
這樣選擇方式會出現(xiàn)兩種結果,一種是系統(tǒng)會自動判定選擇高性能的獨立顯卡,另一種是系統(tǒng)會自動判定選擇集成顯卡。如果系統(tǒng)判定了后者,就會對顯示效果和仿真性能造成顯著影響,極大的影響軟件使用體驗感。
二
NCSIMUL 2025.4新增系統(tǒng)檢測機制
? 在之前的NCSIMUL版本中,大家往往會忽視上面提到的顯卡配置問題,只有當軟件性能產(chǎn)生巨大影響的時候使用者才有可能去查看顯卡設置。但在NCSIMUL 2025.4版本中新增了系統(tǒng)檢測機制,如果軟件使用集成顯卡運行,在仿真的時候會提示報警信息,幫助使用者第一時間規(guī)避此類問題。
三
顯卡設置修改
?當NCSIMUL提示“無硬件圖形加速”的時候,我們就可以設置顯卡,第一種方式可以選擇所有程序都選擇高性能顯卡,第二種方式可以單獨指定NCSIMUL采用高性能獨立顯卡運行。
展開 但對于消費級GPU顯卡,64位雙精度運算由于使用場景較少 (大多數(shù)為一般通用計算任務),廠商為了降低售價提高銷量,削弱了消費級GPU的FP64能力 (但Nvidia RTX 30系以上消費級顯卡基本保留部分FP64能力),導致這些顯卡雙精度計算能力受限。</p><p><br></p><p>對于這些顯卡,在使用時需要考慮更換精度模式保證計算速度。對于Nvidia頂尖顯卡,如A100 (800)、H100 (800) 等,這些顯卡專供HPC科學計算,F(xiàn)P64能力不會削減,因此直接采用雙精度模式計算即可。而對于桌面級顯卡例如 Nvidia RTX 30/40 系顯卡 (如4090等),雙精度模式受限,需適當降低精度保證計算效率。尤其是在試算或者粗略計算大概結果的場景,快速計算十分必要。此時,降低精度快速出結果,對于業(yè)務而言至關重要。</p><p><br></p><p>混合精度模式 (hybrid precision) 為Nvidia特色技術,可根據(jù)GPU狀況,智能對浮點數(shù)據(jù)指定單雙精度策略??梢栽谛屎途戎g取得最佳平衡。</p><p><br></p><p><strong>多GPU使用策略</strong></p><p><br></p><p>最新的EDEM版本已支持調(diào)度多個顯卡 (GPU) 進行并行計算。依舊以小學作比喻,這就仿佛將一個口算任務分配給兩個小學完成。</p><p><br></p><p>一般而言,多GPU僅在問題規(guī)模特別大時使用。因為計算過程中,GPU之間會通信,通信成本較大。因此,盡可能使用單個GPU進行計算。</p><p><br></p><p>但是如果問題規(guī)模特別大,例如數(shù)百萬顆粒的時候,單GPU可能面臨存儲空間不足的情況 (離散單元法不僅計算量大,存儲空間占用也很大)。
展開 電子游戲的「圣杯」
不同于 NVIDIA 在上周的 Siggraph 上推出的首批基于 Turing 架構的工作站級 RTX Quadro 系列顯卡,GeForce RTX 2000 系列作為消費級別的顯卡,其主要應用場景多為運行大型游戲、播放視頻等。而光線跟蹤則是 PC 游戲玩家多年來一直追求的事情,它一直被認為是電子游戲的「圣杯」。
在發(fā)布會上,黃仁勛還展示了多款基于 GeForce RTX 2000 系列的大型游戲的 Demo。在展示中關于光線追蹤的處理令人印象深刻,但大多數(shù)在于物理模型材料、室內(nèi)反射和照明等方面。而關于實際的游戲支持中,NVIDIA 承諾在《古墓麗影:暗影》中進行實時光線追蹤,并在《戰(zhàn)地 V》和《Metro Exodus》中提升照明和其他效果。
其中《古墓麗影:暗影》在夜間場景中通過光線追蹤技術顯示出了更加逼真的陰影和燈光;《Metro Exodus》對于透過窗口的光線處理更加準確,使得游戲開發(fā)者無需再以虛假的光線照亮整個房間,提高了游戲的仿真度,并保證系統(tǒng)資源被合理利用,不再進行多余的渲染操作。
對比標準亟待建立
因為是剛剛發(fā)布的新技術,缺乏統(tǒng)一的衡量指標,NVIDIA 由此發(fā)明了 78T RTX-OPS 計算方法,從而衡量圖靈架構執(zhí)行的光線追蹤操作數(shù)量。
隨著新產(chǎn)品的發(fā)布以及 Demo 的展示,問題也隨之而來:既然衡量性能方式不同,那么新的顯卡如何與舊的顯卡性能相比較?根據(jù) Twitter 上面的反映,不少用戶都提出了這樣的疑問。
NIVIDA 在發(fā)布會上確實做出了展示,證實了光線追蹤優(yōu)化之后為游戲體驗帶來的提升,但并不是每個游戲在發(fā)布就都能夠兼容 RTX 顯卡,而沒有 RTX「加持」的顯卡在游戲中的具體表現(xiàn)對于用戶來說還是未知數(shù),這樣看來了解顯卡的真實性能和表現(xiàn)就顯得尤為重要。
展開 Direct3D11(默認)
WARP
OpenGL
值得一提的是AMD 顯卡驅(qū)動效果不行,可能屬性欄出現(xiàn)鋸齒,黑框。Direct3D11(默認)是最好的顯示性能選項。
AMD顯卡的坑來了:
如果你想配電腦,新買電腦,請盡量避免AMD顯卡。另外你想玩玩ANSYS Discovery live,PTC實時仿真,Keyshot GPU加速渲染,MeshFree無網(wǎng)格仿真軟件等英偉達GPU驅(qū)動的軟件,請購買中端以上的英偉達顯卡,垃圾專業(yè)圖形顯卡P600,P620等盡量避開。
:單精度浮點指標最高的RTX3070Ti
2 3D圖形設計方面
2.1 3D模型實時生成與即時渲染 相關機型:H380
顯卡推薦:像素填充率、顯存帶寬兩者兼顧,RTX3090、RTX3080Ti
3 圖像處理方面
3.1 無人機航拍影像處理、傾斜攝影建模, 相關機型:H380
顯卡推薦:像素填充率、顯存帶寬兩者兼顧,RTX3090、RTX3080Ti
4 視景仿真方面
4.1 大型三維場景、科學可視化、三維GIS應用,相關機型:V390
顯卡推薦:像素填充率、顯存帶寬兩者兼顧,RTX3090、RTX3080Ti
5 影視后期方面
5.1 4K/6K/8K視頻編解碼計算,相關機型:GT400M
5.2 3D渲染計算加速,相關機型:H390、GT400M
顯卡推薦:像素填充率、顯存帶寬兩者兼顧,RTX3090、RTX3080Ti
6 深度學習和大數(shù)據(jù)分析方面
6.1 基于CNN算法的計算機視覺應用加速,相關機型:GX630M
顯卡推薦:半精度浮點指標、Tensor核數(shù)兼顧,RTX3090、RTX3080Ti
應用于深度學習,可能問題:
(1)功耗問題 新卡的功耗比上一代升幅巨大,RTX3090/RTX3080Ti實際功耗到400w以上,對基于GX630M機型,支持8塊GPU卡,可能成為歷史,GX630M配備的雙2000w電源,也不夠用,
(2)散熱問題 上一代GPU卡配備渦輪風扇,多卡并行間距空間很窄,進氣散熱也不錯,但是新GPU因為功耗大幅提升,只能用雙風扇以上的散熱架構,多卡并行原設計間距勢必增大
因此,綜合上面兩個原因,圖靈超算工作站GX630M可能支持最多6塊卡RTX3090/RTX3080Ti
最新的UltraLAB圖形工作站基準配置近期推出
展開 
顯卡的最新內(nèi)容
30萬網(wǎng)格)+ 參數(shù)掃描內(nèi)存駐留
系統(tǒng)盤
2TB NVMe Gen4 SSD
COMSOL安裝包+模型文件快速加載
數(shù)據(jù)盤
4TB NVMe SSD
存儲DOE生成的設計數(shù)據(jù)表(.txt/.csv)
顯卡
系統(tǒng)盤
2TB NVMe SSD(PCIe 4.0,企業(yè)級)
系統(tǒng) + Abaqus/ANSYS 等大型軟件套件
數(shù)據(jù)盤
4TB NVMe SSD(PCIe 4.0)
GCI 多輪結果文件、試驗數(shù)據(jù)對比庫
顯卡
點擊“等值面”或“剖切平面”,服務端即時計算,客戶端流暢顯示結果,絲毫不依賴本地顯卡。</p><p>曾經(jīng)做完仿真就“封存”的結果數(shù)據(jù),現(xiàn)在可以隨時調(diào)出、分享給工藝或測試部門,真正發(fā)揮仿真數(shù)據(jù)的全生命周期價值。</p><p><strong>4安全與運維:從“防不勝防”到“銅墻鐵壁”</strong></p><p>飛機研發(fā)數(shù)據(jù)是國家級秘密。
然而,GPU(通常稱為顯卡)具有不同的架構,其內(nèi)部的計算單元更小但更多。因此,更好的GPU可以提高光線追跡功能。
NVIDIA在2018年將RTX技術推向市場以來,GPU的功能得到了顯著提升。這些GPU包含光線追跡內(nèi)核(RT內(nèi)核),是專門用于優(yōu)化光線傳播的計算單元。為光線追跡提供專用計算單元,可實現(xiàn)更高的性能。
模型訓練在單張NVIDIA RTX 3090 24GB顯卡上完成。測試結果顯示:單次全場流速預測平均耗時僅1秒。更關鍵的是在精度上,流速場峰值結果的相對誤差控制在3%以內(nèi),如圖1所示。當通流孔道的位置發(fā)生變化后,Smart-SIM仍能保持較高的預測精度,如圖2所示。
什么是光線追跡?3個月前
然而,GPU(通常稱為顯卡)具有不同的架構,其內(nèi)部的計算單元更小但更多。因此,更好的GPU可以提高光線追跡功能。
NVIDIA在2018年將RTX技術推向市場以來,GPU的功能得到了顯著提升。這些GPU包含光線追跡內(nèi)核(RT內(nèi)核),是專門用于優(yōu)化光線傳播的計算單元。為光線追跡提供專用計算單元,可實現(xiàn)更高的性能。
智能網(wǎng)格技術與高性能計算
HEXMESH六面體網(wǎng)格自動生成:相比傳統(tǒng)四面體網(wǎng)格,計算精度提升30%-50%
自適應網(wǎng)格重劃分:在大變形分析中自動優(yōu)化網(wǎng)格質(zhì)量
分布式并行計算:支持千核級并行,計算速度提升顯著
GPU加速支持:利用顯卡并行計算能力進一步提升求解效率
4.
FRED MPC快速實例4個月前
準備清單
□ 確保使用的是18.11或之后的版本
□ 確保您的授權支持運行MPC
□ 更新您的顯卡驅(qū)動到最新版本
– www.nvidia.com
檢查FRED
三
顯卡設置修改
?當NCSIMUL提示“無硬件圖形加速”的時候,我們就可以設置顯卡,第一種方式可以選擇所有程序都選擇高性能顯卡,第二種方式可以單獨指定NCSIMUL采用高性能獨立顯卡運行。
GPU: 強烈推薦配置NVIDIA高端顯卡(如RTX 5080/5090或?qū)I(yè)卡RTX 5000/6000),這是提升其核心工作效率(尤其是充填分析)最關鍵的投資
內(nèi)存容量: 128GB是推薦起點,256GB或更高能更好地應對型
3
合研究類
如果客戶同時涉及上述多個領域,需要最均衡、最強大的配置