發布

張量計算的案例

從高通驍龍855的AI加速器看行業的趨勢

與以往高通通常強調其通用DSP可以解決AI計算問題不同，這次高通第一次在SoC上明確集成了一塊專屬AI計算的加速器，可見高通對于AI的重視不同于以往。除此以外，驍龍855的ISP模組也能高效執行AI相關的計算機視覺算法，因此稱為CV-ISP。由于手機端AI絕大部分是計算機視覺應用，因此CV-ISP對于手機端AI應用也是一個重要支撐。高通驍龍855的AI性能強勁這次驍龍855與AI加速相關的芯片模塊亮點主要在DSP和ISP兩部分。首先看DSP部分。DSP部分對于AI的加速主要用于通用AI加速，因為對于非系統應用（例如拍照預測食物卡路里這類應用）來說，DSP更容易調用一些。這次驍龍855里的DSP代號為Hexagon 690，其標量和矢量運算能力相對于上一代驍龍845分別有1.2倍和2倍的提升。在DSP中，標量計算通常用于最基礎的實時數據流計算，其特點是數據的并行性不高，同時數據將以數據流的形式進入DSP并實時完成計算（不同于累積了很多數據再一次完成計算的數據塊模式），在數字濾波等經典通信信號處理算法中有廣泛應用。隨著手機智能化，通信之外的許多計算（例如多媒體應用等計算）也需要在手機端完成，這些計算往往擁有并行性（即許多數據之間彼此獨立，因此可以同時計算，不存在需要先完成數據A的計算才能做數據B的計算的約束），因此這些計算就非常適合使用矢量計算。標量和矢量DSP計算屬于傳統DSP計算。隨著AI應用在手機端的興起，勢必需要新的計算加速單元。目前手機端的AI主要應用包括語音和視覺，尤其以視覺應用為主，而對于視覺相關的AI應用，主流的神經網絡結構是卷積神經網絡（CNN）。CNN中，數據計算以張量計算的形式完成，因此傳統的標量和矢量DSP都不是最適合加速CNN張量計算的計算單元。

展開

每日文章推薦（十二）

英文：micro-mechanical damage models（GTN模型））作者文章基于連續損傷進行分析 lemaitre損傷模型公式如下（引用更加詳細的文獻《Finite element simulation of the punchless piercingprocess with Lemaitre damage model》）：使用mises各項同性屈服+swift硬化模型+lemaitre損傷模型考慮損傷的mises屈服函數：總應變可以加法的分解為彈性部分和塑性部分：等效塑性應變計算公式為：根據廣義hooke定義計算應力增量：塑性流動法則： S為偏應力張量，可以由柯西應力σ張量計算得到： σH是體積應力：根據偏應力張量計算得到mises等效應力： swift硬化模型：硬化模量為：損傷部分基于應變等效性原理（該原理認為：應力σ作用于受損材料引起的應變和實際應力(有效應力)作用于無損材料引起的應變等價），有效應力為：其中D通常為標量函數（也可以作為張量形式使用）考慮各向同性硬化和各項同性屈服，耗散勢函數可以分解為塑性耗散勢和損傷耗散勢： Φ是塑性勢能: 塑性應變率張量定義為： γ是塑性一致性乘子，并滿足KKT條件： s和r是lemaitre損傷函數的參數，并且依賴于使用的材料。通常s取為1。Y是損傷能量釋放率，并定義為：損傷演化表示為：由于lemaitre損傷模型是局部損傷模型，存在網格依賴性。

展開

openFoam幾何面處理工具介紹

在仿真計算中，繁雜的前處理工作往往占據了工作時間，熟練的掌握前處理工具有利于提高我們的工作效率。首先，我們來說一下面網格格式轉換功能即surfaceConvert程序，這個程序不需要任何的字典文件直接在命令行中調用即可，該程序能夠將stl、ftr、stlb、gts、obj、vtk、off、dx、smesh、ac、tri格式的面網格文件轉化成其他格式的面網格格式(面網格格式范圍為上面所示的格式)，如將stl格式文件轉為obj格式文件，而且該程序能夠控制輸出文件的精度(其中精度受限于源文件的進度，輸出文件精度只能小于等于原文件)和對原文件進行縮放。具體命令行輸入如下圖所示：接下來我們說一下另外一個工具使用來計算表面或剛體或殼的慣性張量、主軸和矩的surfaceInertia程序，這個程序同樣不需要任何的字典文件直接調用即可。在計算剛體或殼的慣性張量時需要指定剛體和殼的密度，通過shellProperties來進行剛體和殼之間慣性張量的切換計算，同時還可指定剛體相對參考點慣性張量。其中剛體的慣性張量的計算輸入如下所示：其中標紅部分可用于六個自由度動網格字典文件中的輸入參數。殼體的慣性張量的計算輸入如下圖所示：下面介紹一下將三角面網格文件按面組分割文件，該命令同樣不用字典文件，直接調用即可，其調用情況如下圖所示：最后介紹一下幾何面的旋轉和移動工具surfaceTransformPoints程序，該程序的調用同上面幾個程序一樣，如下圖所示：如圖中所示表示將幾何繞著X軸旋轉30度再繞著z軸旋轉30度更多內容，請關注公眾號：EASYCAE云計算平臺

展開

深度學習訓練與推理計算平臺硬件配置完美選型2020v1

分割的手寫識別、語音識別問題解答系統，機器人控制， DBN深度信念網絡圖像識別、信息檢索、自然語言理解、故障預測 DSN深度堆棧網絡信息檢索、連續語音識別 GAN生成對抗網絡圖像樣式轉換，高分辨率圖像合成，文本到圖像合成，圖像超分辨率[例如小劑量PET重建，異常檢測，3D對象生成[例如牙齒修復]，音樂生成，科學模擬加速度（例如天體物理學或高能物理 Autoencoder自動編碼器推薦系統，圖像重構、聚類、機器翻譯，異常值檢測、數據去噪(圖像、音頻)，圖像修復，信息檢索（二）深度學習主流算法計算特點 2019年，Nvidia（英偉達）公司上市Turing架構的RTX系列的GPU卡，增加了Tensor張量計算單元，大幅提升了深度學習關鍵的矩陣乘法計算、卷積計算（借助張量Tensors）,GPU卡性能的關鍵指標：Tensor張量核數、顯存帶寬、FP16/FP32計算精度目前可選GPU型號（2020年1季度）的主要技術參數型號 CUDA核張量核數顯存1 顯存帶寬2 張量計算3 FP16半精度計算4 FP32單精度計算5 Quadro GV100 5120 640 32 870 133 33.32 16.66 Quadro RTX8000

展開

關于mises應力

mises應力在有限元計算時天天用，還有有必要完全搞懂來龍去脈，如有錯誤，請指正。亂了點，懂的人就不必看了。首先要注意其適用條件，這里不多說。固體中某點處的應力狀態可以用一個應力張量描述。應力張量為二階張量，可將其分解為球量和偏量。球量中的九個分量，非對角元全為0，對角元的值均為應力張量對角元之和的1/3，也即八面體正應力。球量對應于球形應力狀態，可以這樣理解：一個無限小的質點，沉入水中，每個方向都受到相同的壓力，因此一般也稱為靜水壓力，它只引起體積變化，不引起形狀改變。對于金屬材料，即便這個質點沉入水中非常深，還是表現為彈性狀態。因此，一般認為球量不會導致此點進入屈服狀態。偏量為原應力張量減去球量，它只引起形狀變化。外載荷作用在物體上面產生變形，變形過程中作功，不考慮損耗，這些功等于應變能。單位體積的應變能為應變能密度。同應力張量一樣，我們也可以將應變能密度進行分解，一個是體積改變能密度（由球量引起），一個是畸變能密度（由偏量引起），畸變就是形狀改變。由應變能密度公式，用八面體正應力代人可得體積改變能密度，相減得到畸變能密度，它與彈性模量、泊松比以及此點的三個主應力有關。主應力可以根據應力張量計算出來，坐標變化時，應力張量各分量會改變，但是主應力在空間中的方向以及大小都不隨坐標變化。既然屈服主要由偏量引起，因此，可以建立一個屈服準則，它只與偏量有關，無論此點處于何種應力狀態，因此可以采用畸變能密度。此屈服條件認為，某點處應力狀態對應的畸變能密度達到某數值時，此點進入屈服狀態。畸變能密度是一個與該點三個主應力相關的量，還與材料相關，消去這些材料系數，就得到mises應力的計算公式，它也是對該點應力狀態的描述。根據拉伸試驗可以確定材料對應的屈服應力，從而建立屈服條件。

展開

關于mises應力

展開

Moldex3D模流分析之應力分析后處理

X, Y, Z 應力組件 (X, Y, Z Stress Component) 顯示每個方向的正應力大小，也就是應力張量中的XX、YY及ZZ分量。 X 應力分量可使用切割功能與結果剖面功能。使用這些工具能便利檢查3D模型中的物理結果特性。 XY, YZ, ZX 剪切應力 (XY, YZ, ZX Shear Stress) XY 剪切應力用戶也能在模型上使用切割功能與結果剖面功能。 Von Mises應力 (Von Mises Stress) Von Mises應力是應力張量計算的參考標準準則。能用來決定當一項延性材料受到外部力量或應力時是否會開始降伏。如果在塑件某處的Von Mises應力達到降伏強度時，材料將會塑性變形。 Von Mises應力同樣，切割功能與結果剖面功能能協助用戶檢查模型內的Von Mises應力。在分析之后，觀看在不同時間段時位移與殘留應力的變化。 2. 退火分析 (Annealing Analysis) 在退火分析之后，比較翹曲結果的熱 Von Mises 應力與應力結果的 Von Mises 應力。這些結果顯示塑件在退火過程后能有效減少殘留應力。 3. 后熟化分析 (Post Mold Curing Analysis) 在PMC分析之后，檢查應力的結果圖。 4. 型芯偏移 (Core Shift) Moldex3D Studio提供在嵌件上的應力及位移的X、Y、Z分量、總位移、Von Mises形式應力以及壓力的分布，另外，導線架的變形形狀能用設定翹曲范圍顯示： 5.

展開

第16屆全國非線性有限元高級講習班2021年7月29日-31日

2.非線性有限元分析與應用單元 1：單元技術及其分類應用單元 2：線性動態問題單元 3：顯式非線性動態問題單元 4：Explicit 中的準靜態問題單元 5：疲勞壽命分析參加對象 1.企業中從事仿真分析的工程師，科研院所的力學科研人員，高等院校計算力學青年教師和研究生。 2.對學員知識要求：要有基本的彈性力學、塑性力學、有限元、線性代數和簡單張量計算的基礎知識，其知識水平應相當于工學博士和力學專業碩士水平，否則會影響培訓效果。主講專家高原：北京清力行科技有限公司總經理、清華大學計算力學專業博士。曾在中國石化石油工程技術研究院、香港城市大學機械工程系從事產品研發研究，涉及石油、航天航空、汽車、海洋等領域關鍵結構的設計、優化、失效斷裂等力學問題，具有近 16 年的非線性有限元研發經驗，以及豐富的計算仿真經驗與工程問題解決能力。舉辦過多期學術講座，成績斐然，深受好評。曾獲教育部自然科學一等獎、清華大學優秀博士論文等獎勵。培訓形式采用主講和答疑的方式，目的是講授非線性有限元的理論、方法和軟件的發展動態，全面介紹非線性有限元的前沿內容，使參加者能夠了解材料非線性、幾何大變形和接觸等非線性力學的主要問題和解決方法，以及在有限元程序中的實現過程。時間及地點報到時間：2021 年7月28日；培訓時間 7月29日（周四）—7月31日（共 3 天）；培訓地點為北京市（具體地點提前一周發通知）。報名截止日期為 2021年7月20日，以便提前預定賓館和準備培訓資料。證書頒發凡報名參加培訓經考核合格的學員，均頒發培訓證書。報到時每人須交一寸免冠彩色照片 1 張，背面注明姓名（證書用）。

展開

為什么是GPU？

然而，為了準確地建模和模擬現象，需要更多的維度，并且數學上升到向量、矩陣和張量的領域。它們在數學中被視為單個實體，但包含多個值，這意味著任何進行計算的計算機都需要同時處理大量數字。

【8月1-3日北京】清華博導：莊茁、柳占立主講！全國非線性有限元高級講習班

2.非線性有限元分析與應用單元1：單元技術及其分類應用單元2：線性動態問題單元3：顯式非線性動態問題單元4：Explicit中的準靜態問題單元5：疲勞壽命分析三、參加對象 1.企業中從事仿真分析的工程師，科研院所的力學科研人員，高等院校計算力學青年教師和研究生。 2.對學員知識要求：要有基本的彈性力學、塑性力學、有限元、線性代數和簡單張量計算的基礎知識，其知識水平應相當于工學博士和力學專業碩士水平，否則會影響培訓效果。四、主講專家莊茁：清華大學航天航空學院教授、博士生導師，先進力學與材料中心主任，國家973項目首席科學家，從事固體力學、非線性有限元、斷裂力學和飛行器結構力學的研究多年。主持、參與國家自然科學基金項目以及863、973項目11項，完成和正在進行50多項工業和國防課題，發表學術論文180多篇，編著和譯著出版學術專著15部。柳占立：清華大學航天航空學院副教授、博士生導師。2009年獲清華大學博士學位，2009-2012年美國西北大學博士后。主要研究方向為微納米晶體塑性力學、非線性有限元和擴展有限元等。五、培訓形式采用主講和答疑的方式，目的是講授非線性有限元的理論、方法和軟件的發展動態，全面介紹非線性有限元的前沿內容，使參加者能夠了解材料非線性、幾何大變形和接觸等非線性力學的主要問題和解決方法，以及在有限元程序中的實現過程。六、時間及地點報到時間：2019年7月31日；培訓時間：8月1-3日（共3天）；培訓地點為北京市（具體地點提前一周發通知）。報名截止日期為2019年7月31日，以便提前預定賓館和準備培訓資料。七、證書頒發凡報名參加培訓經考核合格的學員，均頒發培訓證書。報到時每人須交一寸免冠彩色照片1張，背面注明姓名（證書用）。

展開

數據科學20個最好的Python庫

PyTorch (Commits: 11306, Contributors: 635) 官網：https://pytorch.org/ PyTorch 是一個大型框架，它允許使用 GPU 加速執行張量計算，創建動態計算圖并自動計算梯度。在此之上，PyTorch 為解決與神經網絡相關的應用程序提供了豐富的 API。該庫基于 Torch，是用 C 實現的開源深度學習庫。 15. Keras (Commits: 4539, Contributors: 671) 官網：https://keras.io/ Keras 是一個用于處理神經網絡的高級庫，運行在 TensorFlow、Theano 之上，現在由于新版本的發布，還可以使用 CNTK 和 MxNet 作為后端。它簡化了許多特定的任務，并且大大減少了單調代碼的數量。然而，它可能不適合某些復雜的任務。 ▌分布式深度學習 16. Dist-keras / elephas / spark-deep-learning (Commits: 1125 / 170 / 67, Contributors: 5 / 13 / 11) 官網： http://joerihermans.com/work/distributed-keras/https://pypi.org/project/elephas/https://databricks.github.io/spark-deep-learning/site/index.html 隨著越來越多的用例需要花費大量的精力和時間，深度學習問題變得越來越重要。然而，使用像 Apache Spark 這樣的分布式計算系統，處理如此多的數據要容易得多，這再次擴展了深入學習的可能性。

展開

蓄勢待發日本芯片再造邊緣智能

在AI芯片的應用定位上，相比主流的云計算AI芯片，日本制造業更側重于研發面向邊緣計算的終端AI芯片，例如，面向物聯網應用的傳感器芯片和自動駕駛輔助系統(ADAS)的芯片。在當前階段，研發這些AI芯片的目的，都是為了增強日本傳統制造業產品的競爭力。表1：全球AI芯片的發力點東芝專門針對深度學習中的張量計算問題，提出用于開發AI芯片的半導體電路技術TDNN(Time Domain Neural Network)，使得AI芯片的電力消耗下降了一半。2017年，日本電裝推出了半導體芯片DFP(Data Flow Processor)，適用于自動駕駛中的認知、判斷、操作等需求。瑞薩推出了一款基于其e-AI(embedded-Artificial Intelligence)構想、適用于自動駕駛深度學習的通用芯片DRP(Dynamically Reconfigurable Processor)。傳統的電子技術巨頭NEC則與東京大學緊密合作，致力于研發下一代類腦計算AI芯片。而富士通推出了面向深度學習的AI芯片DLU(Deep Learning Unit)，并建造了超級計算機“京”。這些跡象表明，日本的AI芯片產業在未來幾年很可能會迎來一個集中的爆發期。蓄勢待發覬覦霸主近年來，日本的資本界進行了幾次實際上足以改變整個人工智能產業格局的收購。由于認識到日本在AI芯片設計上的短板，日本軟銀于2016年用310億美元收購了英國老牌芯片公司ARM，2017年又從谷歌接手了著名的波士頓動力系統公司。

展開

支持7塊RTX3090靜音級深度學習工作站硬件配置方案2021v2

西安坤隆公司的UltraLAB GX630M深度學習工作站可支持到最大6塊RTX3090卡或7塊RTX3070，用于深度學習訓練和推理，該配置的深度學習工作站的張量計算單元（Tensor Core）FP16性能達到1.7PTflops（理論上），這是目前最快的。

音圈對磁路作用力

可以用麥克斯韋張量積分，另外ansoft還可以用虛功法來求力。虛功力比張量積分求解精度高。從我之前后臺收集到的答復來看，很多人還是有誤解的。下面兩張圖是微信群中蔣元武博士分享的動鐵電磁力計算的方法。蔣元武快畢業了，歡迎各大公司搶。 02 — 電磁力的計算方法洛倫茲力運動電荷或通電線圈在磁場中所受到的力稱為洛倫茲力。洛倫茲力計算公式只能計算體積力，就是大家熟悉的F=BL*I。其物理意義十分明顯，且計算十分方便。麥克斯韋張量積分麥克斯韋張量積分計算的是表面張力，需要做閉合積分面。總的力由面積分計算。2維計算時，曲面退化成曲線。張量積分對網格等要求較高。用張量來算好處在于可以求得表面應力分布。 2d軸對稱模型中計算公式 3d模型中計算公式虛功力虛功法，或者說虛位移法對體積力和面積力均可以計算。根據能量守恒原理，磁場中儲能的增加量則等于機械能與電能的總和。我做了一個簡單的表格，匯總相關的磁場仿真軟件和電磁力計算方法。軟件電磁力計算方法洛倫茲力麥克斯韋張量積分虛功力 Comsol √ √ - Ansoft(Ansys) √ - √ Jmag √ √ - Femm √ √ - 評價磁場對音圈的力對網格等要求較高從能量守恒角度

展開

地平線的「新征程」與自主品牌汽車的「新機遇」

也就是說，征程 5 芯片兼顧了計算的「快」，識別的「準」的特點。為什么是地平線做出來了？在發布會上，黃暢博士給了答案，那就是架構設計。征程 5 采用了地平線自研的第三代雙核 BPU 貝葉斯架構，支持 2.5D/3D AI 算法硬件原生加速。這套架構最大的特點是「豐富的異構計算資源」：在視覺處理上，地平線采用 2 個車用 ISP，可實現 1.3 GP/s 的像素處理，同時支持「在線」實時處理 HDR 高動態范圍圖像。在異構計算上，征程 5 搭載了 8 個 A55 DynamlQ CPU 集群，可以實現數據的后處理、融合以及行為的預測決策的規劃，還有建圖能力；2 個視覺 P6 DSP 可實現 3D 場景重建（運動恢復架構 SFM）、視覺測距等；還有專用的 CV 加速器，利用 CV 加速引擎可實現對圖像的畸變矯正、拼接和流光處理。簡單理解就是，貝葉斯架構利用異構計算單元提供針對場景的最佳計算模式配比，實現降低計算功耗與延遲；利用高靈活大并發數據橋提升計算單元利用率；通過脈動張量計算核降低計算功耗、延遲和所需要的數據帶寬，最終通過編譯優化算法，達成高度并行的計算能力，這樣就有了征程 5 強大的真實 AI 性能輸出。征程 5 已經通過了 ASIL - B 功能安全認證，基于征程 5 的系統可達到 ASIL - D 功能安全水準，并可通過安全島設計進行全時追控。

展開

共39條

首頁 123 下一頁尾頁 , 到第頁

不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

張量計算的案例

張量計算的相關專題、標簽、搜索