發(fā)布

CUDA的案例

精通 GPU 并行編程（CUDA）：硬件與軟件￥20

文中使用的 “CUDA”、“Nsight” 及架構(gòu)代號(hào)均為 NVIDIA 的商標(biāo)，僅用于事實(shí)性描述。課程核心技能 - GPU 與 CPU 基礎(chǔ)：GPU 為何在數(shù)據(jù)并行任務(wù)中占優(yōu)勢(shì) - 架構(gòu)代際演進(jìn)：對(duì)性能影響最大的硬件特性 - CUDA Toolkit 安裝：Windows、Linux、WSL 環(huán)境配置與首次運(yùn)行驗(yàn)證 - CUDA 核心概念：線程（thread）、塊（block）、網(wǎng)格（grid）、內(nèi)存層次結(jié)構(gòu)，并通過(guò)向量加法等實(shí)驗(yàn)鞏固 - 使用 Nsight Compute / nvprof 進(jìn)行性能分析與調(diào)優(yōu)：測(cè)量占用率（occupancy）、隱藏延遲、定位性能瓶頸 - 矩陣二維索引：編寫(xiě)高效的線性代數(shù)內(nèi)核 - 優(yōu)化方法：處理非 2 的冪數(shù)據(jù)、利用共享內(nèi)存、最大化帶寬、最小化 warp 分化 - 調(diào)試與錯(cuò)誤處理：使用運(yùn)行時(shí) API 檢查，編寫(xiě)可交付的穩(wěn)健代碼課程收獲完成課程后，學(xué)習(xí)者將能夠設(shè)計(jì)、分析并調(diào)優(yōu)在現(xiàn)代 GPU 上高效運(yùn)行的 CUDA 內(nèi)核，具備處理科學(xué)計(jì)算、工程計(jì)算與 AI 任務(wù)的能力。 5. 適用人群 - 對(duì) GPU 與 CUDA 感興趣的學(xué)習(xí)者 - 工程專業(yè)學(xué)生、研究人員及其他相關(guān)從業(yè) Mastering GPU Parallel Programming with CUDA: ( HW & SW )

展開(kāi)

通用計(jì)算軟件Mathematica7支持CUDA性能提升百倍

在美國(guó)德克薩斯州舉行的超級(jí)計(jì)算大會(huì)(SC08)上，Wolfram Research宣布新版通用計(jì)算軟件Mathematica 7將支持NVIDIA CUDA GPU并行計(jì)算技術(shù)。據(jù)稱，融入CUDA技術(shù)的Mathematica 7可以在數(shù)學(xué)運(yùn)算、建模、模擬和視覺(jué)計(jì)算等方面獲得10倍甚至100倍的性能提升，而且不需要用戶另外學(xué)習(xí)或者編寫(xiě)C語(yǔ)言代碼。配合NVIDIA同時(shí)發(fā)布的Tesla個(gè)人超級(jí)計(jì)算機(jī)，Mathematica 7可以在桌面上執(zhí)行復(fù)雜的數(shù)據(jù)計(jì)算任務(wù)，免除了編寫(xiě)原生C程序或等待公共集群的麻煩，為研究人員節(jié)省大量的工作時(shí)間。支持CUDA加速的新版Mathematica 7將在2009年第一季度提供，而剛剛發(fā)布的普通版Mathematica 7已經(jīng)面世，在12個(gè)應(yīng)用領(lǐng)域增加了500多個(gè)新功能，包括圖像處理、并行高性能計(jì)算、矢量場(chǎng)視覺(jué)化、布爾數(shù)學(xué)體系運(yùn)算、統(tǒng)計(jì)模式分析等等。 Mathematica可以說(shuō)是世界上最強(qiáng)大的通用計(jì)算系統(tǒng)，自1988年首次發(fā)布以來(lái)已經(jīng)擁有數(shù)百萬(wàn)用戶，對(duì)如何在科技和其它領(lǐng)運(yùn)用計(jì)算機(jī)有著深刻的影響，并成為許多機(jī)構(gòu)的標(biāo)準(zhǔn)工具，比如財(cái)富50強(qiáng)的所有公司、美國(guó)政府15個(gè)主要機(jī)構(gòu)、全球最大的50所大學(xué)等等。 Mathematica 7支持Windows 2000/XP/Vista、Mac OS X、Linux x86、Solaris、UltraSPARC/x86等平臺(tái)，建議零售價(jià)2495美元(北美)或3120美元(亞洲)，還提供1095/1315美元的教育版和140美元的學(xué)生版。 10臺(tái)頂級(jí)8核服務(wù)器速度-Tesla個(gè)人超級(jí)計(jì)算機(jī) 并行計(jì)算王者－Tesla個(gè)人超級(jí)計(jì)算機(jī)硬件配置

展開(kāi)

在 COMSOL Multiphysics 中設(shè)置 GPU 加速計(jì)算

?? COMSOL Multiphysics 6.3 安裝程序的屏幕截圖，其中包含產(chǎn)品頁(yè)面打開(kāi)，并突出顯示 CUDA DNN 支持復(fù)選框。第 2 步：選項(xiàng)頁(yè)面 Options （選項(xiàng)）頁(yè)面的 CUDA 部分包含一個(gè) CUDA Directory 字段，用于 CUDA Toolkit 安裝路徑。在大多數(shù)情況下，在啟動(dòng) COMSOL Multiphysics 安裝程序之前安裝 CUDA 工具包會(huì)設(shè)置環(huán)境變量，讓安裝程序自動(dòng)檢測(cè)此路徑。如果未自動(dòng)檢測(cè)到正確的 CUDA Toolkit 目錄，則可以在安裝程序中設(shè)置路徑，或者在安裝完成后在 Preferences （首選項(xiàng)）窗口設(shè)置中更改路徑。? COMSOL Multiphysics 6.3 安裝程序的屏幕截圖，其中包含選項(xiàng)頁(yè)面打開(kāi)，并在 CUDA Directory 字段中顯示默認(rèn) CUDA Toolkit 安裝路徑。在 COMSOL Multiphysics 中驗(yàn)證 CUDA 工具包的安裝? 安裝并配置 COMSOL Multiphysics 和 CUDA 工具包后，您可以通過(guò)啟動(dòng) COMSOL Multiphysics 并打開(kāi)首選項(xiàng)窗口來(lái)驗(yàn)證您的安裝。通過(guò)轉(zhuǎn)到 File 菜單并選擇 Preferences 來(lái)執(zhí)行此作。從那里，您可以導(dǎo)航到 Computing 部分，然后單擊 GPU Acceleration 頁(yè)面。最后，單擊 Verify CUDA 安裝按鈕。??? 這偏好窗口中，帶有??驗(yàn)證 CUDA 安裝對(duì)話框是否打開(kāi)。

展開(kāi)

全過(guò)程記錄---檢查PyTorch是否在使用GPU

__version__) (2) 檢查是否可使用CUDA torch.cuda.is_available() (3) 檢查CUDA版本 torch.version.cuda (4) 檢查有幾個(gè)GPU torch.cuda.device_count() (5) 檢查目前的GPU torch.cuda.current_device() (6) 檢查目前GPU的設(shè)備名稱 torch.cuda.get_device_name(torch.cuda.current_device()) (7) 檢查內(nèi)存 torch.cuda.memory_allocated(0)/1024**3torch.cuda.memory_reserved(0)/1024**3 5 結(jié)束語(yǔ) 目前的配置如下: PyTorch 版本1.9.0+cu102，只有1個(gè)GPU, 設(shè)備名稱GeForce GTX 1660 SUPER, 顯存6G。查了一下，發(fā)現(xiàn)這是2019年10月推出的產(chǎn)品，目前的市場(chǎng)價(jià)格大約在1600元。接下來(lái)我們的訓(xùn)練模型將在GPU上運(yùn)行，但不知速度能提高多少。

展開(kāi)

異構(gòu)加速計(jì)算崛起，不應(yīng)只是關(guān)注計(jì)算芯片

AMD states that “HIP code can run on AMD hardware (through the HCC compiler) or Nvidia hardware (through the NVCC compiler) with no performance loss compared with the original CUDA code.” AMD 異構(gòu)計(jì)算可移植接口 (HIP) 是一種 C++ 方言。 AMD 工具包括“HIPify 工具”，可幫助將 CUDA 代碼轉(zhuǎn)換為 HIP。 AMD 表示，“HIP 代碼可以在 AMD 硬件（通過(guò) HCC 編譯器）或 Nvidia 硬件（通過(guò) NVCC 編譯器）上運(yùn)行，與原始 CUDA 代碼相比，不會(huì)有任何性能損失。” HIP is a “follow CUDA” strategy – i.e., where AMD develops an update to HIP as quickly as possible after Nvidia has released an update to its CUDA platform. The arguments in favor of HIP rest on the virtue of reuse of a large CUDA codebase for AMD GPUs. Unfortunately, given the opaqueness of CUDA no one can follow CUDA too closely, timely, or accurately.

展開(kāi)

Abaqus實(shí)現(xiàn)GPU加速的完整配置操作手冊(cè) ￥50

本文檔詳細(xì)說(shuō)明Abaqus軟件借助 NVIDIA CUDA 實(shí)現(xiàn)Standard 求解器 GPU 加速的完整流程，包含環(huán)境檢查、CUDA 安裝、軟件關(guān)聯(lián)、加速啟用與效果驗(yàn)證全步驟，同時(shí)明確使用限制與常見(jiàn)問(wèn)題，可直接用于工程仿真配置參考。文檔目錄為：一、使用限制與要求二、檢查電腦 CUDA 支持版本三、下載適配版本的 CUDA Toolkit 四、CUDA Toolkit 安裝步驟五、CUDA 與 Abaqus 關(guān)聯(lián)配置六、Abaqus 中啟用 GPU 加速與效果驗(yàn)證七、常見(jiàn)問(wèn)題與注意事項(xiàng) 八、其他

展開(kāi)

英偉達(dá)放出12年來(lái)最大招：全新圖靈架構(gòu)登場(chǎng)，全球首批即時(shí)光線追蹤GPU同步亮相

CUDA10 CUDA是構(gòu)建英偉達(dá)GPU加速的軟件，與之前的版本相比相比，CUDA10具有的新特性包括：支持圖靈架構(gòu); 新增性能優(yōu)化庫(kù)，在16-GPU系統(tǒng)中實(shí)現(xiàn)強(qiáng)大的FFT性能擴(kuò)展; nvJPEG：用于混合JPEG處理的新庫(kù)，單個(gè)和批量圖像解碼速度是原來(lái)2倍; CUDA / Graphics Interop：CUDA和圖形API之間的新互操作性; 新的開(kāi)發(fā)人員工具：用于跟蹤，分析和調(diào)試CUDA應(yīng)用程序的新Nsight產(chǎn)品系列工具。在軟件層面，英偉達(dá)還宣布開(kāi)放MDL。當(dāng)然，黃仁勛最后還表示從Adobe(針對(duì)Dimension CC)到皮克斯、Siemens、Black Magic、Weta Digital、Epic Games和Autodesk等公司已經(jīng)簽約支持新的圖靈架構(gòu)。雷鋒網(wǎng)認(rèn)為這將讓產(chǎn)品設(shè)計(jì)師、游戲設(shè)計(jì)師、建筑師們的光線計(jì)算開(kāi)始變得簡(jiǎn)單。作者：包永剛來(lái)源：雷鋒網(wǎng)（leiphone-sz）

展開(kāi)

利用Amber進(jìn)行動(dòng)力學(xué)模擬和結(jié)合自由能計(jì)算

/bin/bash module add Anaconda3/2020.02 source /public/software/.local/easybuild/software/amber/aber20/amber.sh ulimit -s unlimited ulimit -l unlimited antechamber -i ligand.mol2 -fi mol2 -o ligand.ante.mol2 -fo mol2 parmchk2 -i ligand.ante.mol2 -f mol2 -o ligand.frcmod pdb4amber -i protein.pdb -o rec.pdb --reduce --dry -y --nohyd tleap -s -f tleap.in pmemd.cuda -O -i min.in -o min.out -p com_solvated.prmtop -c com_solvated.inpcrd -r min.rst -ref com_solvated.inpcrd pmemd.cuda -O -i heat.in -o heat.out -p com_solvated.prmtop -c min.rst -r heat.rst -x heat.mdcrd -ref min.rst pmemd.cuda -O -i density.in -o density.out -p com_solvated.prmtop -c heat.rst -r density.rst -x density.mdcrd -ref heat.rst pmemd.cuda -O -i equil.in -o equil.out -p com_solvated.prmtop -c density.rst -r equil.rst

展開(kāi)

當(dāng)AI侵入嵌入式設(shè)計(jì)......

而且不只是DNN inferencing，Jetson Nano的CUDA架構(gòu)可用來(lái)做更大范圍的計(jì)算機(jī)視覺(jué)、DSP，包括各種算法和操作。尤為值得一提的是，上面這些模型在Jetson Nano上執(zhí)行用上了TensorRT。對(duì)英偉達(dá)AI生態(tài)熟悉的同學(xué)應(yīng)該知道，TensorRT是英偉達(dá)推的一個(gè)中間件，輸入模型后，CUDA GPU藉由TensorRT就能生成優(yōu)化過(guò)后的模型運(yùn)行時(shí)，是英偉達(dá)實(shí)現(xiàn)AI計(jì)算性能優(yōu)化的重要組成部分。 TesnorRT作為一種軟件，是前面的例子中實(shí)現(xiàn)更高幀率，達(dá)成更高計(jì)算效率的重要組成部分。有研究人員測(cè)試過(guò)不用TensorRT優(yōu)化，在Jetson Nano 2G上直接編譯一個(gè)版本的Caffe模型，雖然問(wèn)題也不大，不過(guò)經(jīng)過(guò)TensorRT加速的版本在效率上會(huì)有相當(dāng)大的提升。由TensorRT可引出的，一方面是英偉達(dá)每年在講自己不是或不只是一家芯片公司，另一方面這也是Jetson Nano生態(tài)資源有英偉達(dá)做靠山的管中一窺。簡(jiǎn)單來(lái)說(shuō)，Jetson全系列所有硬件平臺(tái)對(duì)各種軟件工具和SDK的通用：Jetson Nano開(kāi)發(fā)套裝軟件部分是JetPack SDK，包括Ubuntu操作系統(tǒng)，還有構(gòu)建端到端AI應(yīng)用的各種庫(kù)，比如說(shuō)用于計(jì)算機(jī)視覺(jué)和圖像處理的OpenCV和VisionWorks；加速AI inferencing的CUDA、cuDNN、TensorRT，還有各種庫(kù)。英偉達(dá)此前在營(yíng)銷(xiāo)上，把各種軟件加速庫(kù)稱作CUDA-X軟件棧（不過(guò)今年好像沒(méi)怎么提這個(gè)詞）。這其中比較典型，可列舉的與Jetson Nano強(qiáng)相關(guān)的，包括了針對(duì)智能視頻流分析的Nvidia DeepStream，針對(duì)醫(yī)療成像、基因和病人監(jiān)護(hù)的Clara，以及用于機(jī)器人的Isaac等。

展開(kāi)

使用Tesla P100運(yùn)行ANSYS Discovery 2025 R1 ￥20

在選擇驅(qū)動(dòng)時(shí)，原則是選擇同一版本下，盡量選擇CUDA版本高的驅(qū)動(dòng)。驅(qū)動(dòng)版本可以多試幾次，每次安裝新驅(qū)動(dòng)前，需要用DDU（顯卡驅(qū)動(dòng)卸載工具，DisplayDriverUninv）完全卸載舊版本的驅(qū)動(dòng)。驅(qū)動(dòng)一定要從官網(wǎng)上下載。（2）切換顯卡模式切換前顯卡默認(rèn)處于TCC模式，在桌面單擊右鍵，從菜單中選擇“NVIDIA控制面板”，會(huì)如下圖所示（網(wǎng)上搬來(lái)的示意圖，顯卡型號(hào)不同）：通過(guò)修改注冊(cè)表來(lái)切換顯卡模式，具體步驟可以在網(wǎng)上搜索或看收費(fèi)部分。完成以上操作后，在桌面單擊右鍵，從菜單中選擇“NVIDIA控制面板”，P100會(huì)處于WDDM模式，會(huì)如下圖所示（網(wǎng)上搬來(lái)的示意圖，顯卡型號(hào)不同），可選菜單會(huì)增加：（3）安裝Ansys Discovery 具體安裝步驟可以在網(wǎng)上搜索教程。 4、與顯卡相關(guān)的問(wèn)題及解決方法（1）啟動(dòng)時(shí)提示找不到OpenGL驅(qū)動(dòng)或驅(qū)動(dòng)版本低（2）提示CUDA版本低解決方法見(jiàn)收費(fèi)部分。

展開(kāi)

英偉達(dá)被黑客組織勒索，網(wǎng)友從泄露數(shù)據(jù)中挖出核心機(jī)密信息

RTX 40系顯卡信息被挖出：1.8萬(wàn)個(gè)CUDA核心此外，部分獲得了這些數(shù)據(jù)的人已經(jīng)開(kāi)始了對(duì)代碼的分析、并試圖弄懂DLSS的工作原理。不同于競(jìng)品中的AMD FSR采樣技術(shù)和英特爾XeSS采樣技術(shù)，英偉達(dá)之前從未公布過(guò)DLSS的源代碼，很不愿意將這個(gè)大量掙錢(qián)的獨(dú)有技術(shù)給開(kāi)源了。德國(guó)computerbase網(wǎng)站就對(duì)網(wǎng)友的挖掘進(jìn)行了匯總： RTX 40系列的大核心是AD102，有144組SM單元（也可以叫做CU計(jì)算單元），考慮到RTX 30系的安培GPU中就改為每組SM單元128個(gè)CUDA核心，那么AD102核心就是18432個(gè)CUDA單元，比GA102核心提升71%，規(guī)模大幅提升。如果再考慮到之前爆料稱RTX 40顯卡上了5nm工藝之后頻率可達(dá)2.5GHz，那么RTX 4090性能比現(xiàn)在的RTX 3090翻倍也沒(méi)啥懸念了。 AD102核心之后是AD103核心，84組SM單元，1072個(gè)CUDA核心，規(guī)模相當(dāng)于現(xiàn)在的GA102核心，也增加了40%的核心規(guī)模，性能提升也值得期待。之后的GA104核心則是60組SM單元，7680個(gè)CUDA核心。AD106、AD107核心分別是36組、24組SM單元，4608、3072個(gè)CUDA核心了，規(guī)模提升就不那么明顯了。此外，在黑客泄露的文件中，還包括DLSS源代碼。DLSS也就是深度學(xué)習(xí)超采樣，NVIDIA Ampere架構(gòu)引入的一種超分辨率畫(huà)質(zhì)增強(qiáng)技術(shù)，可以大幅提升游戲幀率，尤其是搭配RTX光追技術(shù)，可以兼顧高畫(huà)質(zhì)、高幀率。AMD FSR、Intel XeSS，可以說(shuō)都是被它引領(lǐng)出來(lái)的。

展開(kāi)

磁學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室的計(jì)算利器---高速計(jì)算設(shè)備硬件配置推薦

2) GPU加速：MuMax3支持通過(guò)CUDA技術(shù)利用GPU進(jìn)行加速計(jì)算。對(duì)于具備CUDA兼容性的NVIDIA GPU，可以通過(guò)配置使用GPU進(jìn)行計(jì)算，以加快仿真速度。 3) 顯卡圖形要求：對(duì)于使用GPU加速的情況，MuMax3對(duì)顯卡圖形有一定要求。它需要支持CUDA并具備足夠的計(jì)算能力。 4) 內(nèi)存容量要求：具體的內(nèi)存容量要求取決于模型的復(fù)雜度和計(jì)算規(guī)模。較大的內(nèi)存容量可能有助于處理大型模型和復(fù)雜的仿真。 5) 硬盤(pán)IO要求：MuMax3在計(jì)算過(guò)程中會(huì)產(chǎn)生大量的數(shù)據(jù)文件，因此具有較快的硬盤(pán)I/O速度可以提高仿真的效率。使用固態(tài)硬盤(pán)（SSD）或具有較高讀寫(xiě)速度的硬盤(pán)可能會(huì)有所好處。 6) 計(jì)算瓶頸：在使用MuMax3進(jìn)行仿真時(shí)，計(jì)算瓶頸通常出現(xiàn)在模型復(fù)雜度較高、網(wǎng)格數(shù)量較多或者時(shí)間步長(zhǎng)較小的情況下。此時(shí)，計(jì)算時(shí)間可能會(huì)顯著增加。為了加速M(fèi)uMax3的計(jì)算，可以考慮以下配置方面的改進(jìn)：對(duì)于多核計(jì)算，使用具有更高核心數(shù)的CPU。對(duì)于GPU加速，選擇具備CUDA兼容性且計(jì)算能力較高的NVIDIA GPU，另外需要雙精度GPU卡。增加內(nèi)存容量以容納大型模型和復(fù)雜的仿真。使用高速硬盤(pán)，如固態(tài)硬盤(pán)（SSD），以提高數(shù)據(jù)讀寫(xiě)速度。

展開(kāi)

技術(shù)干貨丨如何選用顯卡 (GPU) 開(kāi)展EDEM的計(jì)算？

EDEM GPU計(jì)算架構(gòu) 目前EDEM GPU求解器使用Nvidia CUDA實(shí)現(xiàn)，已支持多球團(tuán)簇 (multi-sphere)、膠囊體 (sphero-cylinder) 和多面體 (polyhedral) 全部三種顆粒形態(tài)，并已全面支持API自定義模型，計(jì)算效率與內(nèi)置模型無(wú)異。Nvidia CUDA是全球主流GPU高性能計(jì)算 (HPC) 架構(gòu)，歷史最為悠久，在國(guó)際上具有廣泛的用戶基礎(chǔ)，迭代更新快。 然而，Nvidia CUDA僅支持Nvidia品牌的顯卡，諸如AMD等品牌的顯卡無(wú)法使用Nvidia CUDA進(jìn)行計(jì)算，也無(wú)法使用EDEM GPU計(jì)算。(先前EDEM GPU求解器使用OpenCL架構(gòu)實(shí)現(xiàn)，OpenCL支持Nvidia和AMD等全品類(lèi)顯卡。但OpenCL已停止更新，鑒于此，EDEM最新版GPU運(yùn)算已不再支持OpenCL求解器。) EDEM 對(duì)顯卡的最低配置要求如下： <ol><li>支持CUDA，且計(jì)算能力支持版本3.5以上 (詳見(jiàn)CUDA GPUs - Compute Capability | NVIDIA Developer)。除個(gè)別極為古老的顯卡 (如Nvidia GTX系列)，基本都滿足該條件。</li><li>驅(qū)動(dòng)程序中，CUDA版本11.0以上。</li></ol> 對(duì)EDEM計(jì)算而言，幾萬(wàn)到十幾萬(wàn)顆粒的計(jì)算規(guī)模，選擇普通家用顯卡 (如游戲顯卡) 足以。后文會(huì)詳述顯卡的選取。

展開(kāi)

AI是FPGA企業(yè)苦等的殺手級(jí)應(yīng)用嗎？

Nvidia為希望使用Nvidia GPU加速其應(yīng)用程序的軟件開(kāi)發(fā)人員創(chuàng)建了一種名為CUDA（類(lèi)似于OpenCL）的專有語(yǔ)言。當(dāng)OpenCL出現(xiàn)時(shí)（名稱中帶有令人討厭的“Open”）Nvidia宣布了對(duì)OpenCL的“支持”，但顯然它們大部分努力都落后于CUDA，他們的CUDA客戶非常樂(lè)意繼續(xù)編寫(xiě)CUDA代碼，非常感謝你。 CUDA和Nvidia在GPU加速市場(chǎng)的成功阻礙了OpenCL的采用，這大大減緩了OpenCL作為從基于GPU的加速到基于FPGA的加速的橋梁——這正是Nvidia想要達(dá)到的。此外，許多神經(jīng)網(wǎng)絡(luò)專家尚未采用OpenCL或CUDA。他們需要更多幫助來(lái)減小他們訓(xùn)練有素的模型和基于FPGA的推理引擎之間的差距。許多公司正在攻擊這個(gè)非常重要的問(wèn)題，我們將來(lái)會(huì)對(duì)它們進(jìn)行更多的討論。但就目前而言，基于FPGA的神經(jīng)網(wǎng)絡(luò)推理基本上僅限于能夠與其神經(jīng)網(wǎng)絡(luò)/ AI工程師一起部署FPGA專家的組織。事實(shí)上，這個(gè)問(wèn)題很可能是我們?cè)缜白珜?xiě)的Xilinx /戴姆勒聯(lián)盟的驅(qū)動(dòng)因素—— 戴姆勒可能需要Xilinx幫助在Xilinx硬件上實(shí)現(xiàn)其汽車(chē)專用AI算法。除了編程問(wèn)題之外，F(xiàn)PGA在不可替代性方面還存在另一個(gè)障礙。在大容量嵌入式應(yīng)用（例如汽車(chē)）中，解決方案將隨著時(shí)間的推移變得具體和有限。這意味著將不再需要FPGA的靈活性。如果行人識(shí)別網(wǎng)絡(luò)被證明是有效的，那么該應(yīng)用的硬件仍然可以硬化，可能會(huì)大大提高性能，降低功耗，并且（最重要的是）降低成本。 FPGA只用于最先進(jìn)而系統(tǒng)、架構(gòu)不斷變化的芯片。例如，我們與Lidar的制造商進(jìn)行了交談，他們?cè)谙到y(tǒng)中使用了大量的FPGA。雖然他們正在生產(chǎn)汽車(chē)應(yīng)用市場(chǎng)上性能最佳的系統(tǒng)之一，但他們的系統(tǒng)成本仍然是五位數(shù)。

展開(kāi)

3D Gaussian Splatting從入門(mén)到精通——純PyTorch實(shí)現(xiàn)（全套案例）￥30

五、適合人群 - 希望從代碼層面深入理解3D高斯?jié)姙R的研究人員、研究生或工程師 - 對(duì)神經(jīng)渲染感興趣，或希望從零實(shí)現(xiàn)高級(jí)3D視覺(jué)技術(shù)的Python/PyTorch開(kāi)發(fā)者 - 希望避開(kāi)CUDA繁重代碼庫(kù)，構(gòu)建清晰、可修改實(shí)驗(yàn)流水線的人士 - 在計(jì)算機(jī)視覺(jué)、圖形學(xué)或AI領(lǐng)域工作，希望探索或擴(kuò)展3DGS用于研究或原型開(kāi)發(fā)的個(gè)體 - 熟悉NeRF或類(lèi)似方法，希望了解3DGS優(yōu)勢(shì)及技術(shù)差異的學(xué)習(xí)者 ? 注：課程內(nèi)容基于2025年11月發(fā)布版本，技術(shù)細(xì)節(jié)可能隨領(lǐng)域發(fā)展略有更新。建議結(jié)合官方GitHub倉(cāng)庫(kù)或最新研究論文進(jìn)行學(xué)習(xí)。

CUDA的相關(guān)專題、標(biāo)簽、搜索

CUDA NVIDIA CUDA abaqus設(shè)置cuda ansys19 cuda cuda 2944 cuda cuda仿真 cuda malloc cuda并行 cuda加速

共124條

首頁(yè) 12345...9 下一頁(yè) 尾頁(yè) , 到第頁(yè)

不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

CUDA的案例

CUDA的相關(guān)專題、標(biāo)簽、搜索