
發布
注冊
/
登錄降維的案例
CAESES中基于主成分分析的參數降維功能應用
四、基于降維采樣
靜水阻力用shipflow計算,連接完成后,提取出優化目標Rt。點擊Optimize>Sobol,進行采樣。
設置采樣數200,應用dimensionalityReduction1,設置優化目標Rt,點擊綠色按鈕開始。
基于降維后的6個主參數sobol采樣點的分布與基于17個設計變量采樣點分布有明顯區別。下圖為基于17個變量的樣本點分布情況,可以看出200個樣本點在設計空間均勻分布。
Sobol樣本點分布(降維前)
降維后,200個樣本點分布更集中,可以理解為采樣更集中在變形的高效區。
Sobol樣本點分布(降維后)
采樣結果如下圖所示,降維前最優Rt=83.2188N,較母型船優化2.5%,降維后最優Rt=81.3979N,優化4.7%。
降維前(左)與降維后(右)Rt采樣結果對比
五、基于降維優化
基于采樣的最優結果進行50次基于TSearch算法的優化,優化歷程如下圖:
降維前(左)與降維后(右)Rt優化歷程對比
由圖可知,基于降維后的6個主參數的優化收斂效果明顯更好。最終的優化結果為:降維前Rt=82.2869N,優化3.6%,降維后Rt=80.708N,優化5.5%。
六、結論
利用參數化降維方法允許用戶在設計階段選擇更多的設計變量,并在優化階段通過降維減少設計變量的個數,有效降低優化成本,減少優化項目的時間,并取得更好的優化效果。具體比較見下表:
注:采用CFD軟件為SHIPFLOW 7. 1 。單個算例仿真時長為40分鐘。
展開 降維超導、堆砌如花
降維超導
在歷史悠久、歷久彌新的過渡金屬二硫化物領域,黃富強們更是如魚得水、收獲頗豐。過渡金屬二硫化物,乍一看只有兩個元素組成而且組分固定,能玩出什么花頭來?事實上,這還真是一個扮豬吃虎之輩。僅以晶體結構而言,就可變換出2H、3R、1T、1T’、1T’’、1T’’’等不同花樣。這些物相所表現出來的物性,均是包括超導、電荷密度波、熱電等量子材料界爭相追逐的對象。
令人稱道的是,這類化合物一般具有層狀結構,很適合對其進行“降維操控”,從而探究二維下的物理特性。因此,她們也深得專注于二維材料研究的人士所喜愛。所謂“降維”,即通過剝離技術將層狀結構一層一層剝離,直到盡頭。所謂“操控”,即對二維體系進行加工、處理與調控。最近幾年,黃富強們也發展出剝離高溫固相合成的LiMS2 (M 為過渡金屬元素) 晶體的方法,獲得了高純度的MS2 納米片、甚至單晶 (如圖1 所示)。他們成功運用這一技術制備了 NbS2、TaS2、TiS2、MoS2、WS2 等材料。當然,黃富強們也多與國內外同行,包括筆者所在的中科院上海微系統所(謝曉明、牟剛)合作,表征與調控其中的超導性能。結果還真看到了一些新的、不同于常規體系超導電性的現象與物理。有興趣的看君,可關注針對 TaS2 的工作 [JACS 139, 4623 (2017)]、針對 MoS2 的工作 [Angew. Chem. 130, 1246 (2018)]、以及針對WS2 的工作 (arXiv:1808.05324)。
本文將主要看看 TaS2 為主角的表演。
圖2. (a) 重堆疊 TaS2 納米片的結構示意圖。(b) 重堆疊 TaS2 納米片的 XRD 圖譜。(c) 重堆疊 TaS2 納米片的磁化數據。(d) 重堆疊 TaS2 納米片的電阻-溫度曲線。
展開 直播課程 | 智能實時CAE仿真在汽車行業應用之:模型降維
課程名稱:智能實時CAE仿真在汽車行業的應用之“模型降維”
直播時間:2020-10-21 (星期三) 14:00-15:00
立即報名:https://mpages.mscsoftware.com/WBNCH-ALL2020-10-21CADLMPrattMiller_LP-Registration.html
1
直播主題與時間
智能實時CAE仿真在汽車行業應用之:模型降維
2020年10月21日(星期三)14:00~15:00
2
您所期待的內容
智能實時仿真軟件之模型降維模塊功能及基本原理:
如何定義樣本空間、DOE方法
如何運行很少但很明智的選擇樣本點
是否能夠自適應學習 (在學習中進步)
如何智能實時的進行參數化研究和優化
標致雪鐵龍集團(PSA)機器學習案例:
側面碰撞 & 動剛度
奧迪汽車(AUDI)機器學習案例:
底盤力虛擬調校 & 兼顧全頻段舒適性
豐田汽車(TOYOTA)機器學習案例 :
前部碰撞/CFD
Pratt & Miller工程和制造公司機器學習案例
3
適合誰來參加
各行業想要轉型/兼職機器學習的CAE部門主管、工程師
仿真/試驗數據管理的IT部門主管&工程師
已經正在進行優化,尤其是多學科優化的工程師
對機器學習技術在CAE行業最新應用和案例,感興趣的人員
4
參會方式
掃描下方二維碼注冊
或點擊注冊:https://mpages.mscsoftware.com/WBNCH-ALL2020
展開 gofarlic軟件許可優化是縮小差距的“降維打擊”!
這個案例說明,軟件許可優化不僅節省成本,還能提升效率,這就是所謂的“降維打擊”——你可能還在抱怨成本高,但競爭對手已經用更聰明的方式管理資源。
五、學習技巧:如何引導企業進行許可優化?
對于政策制定者或決策者軟件許可優化可能不是一個你親身參與的過程,但你以下幾點來引導企業走向更智能的資源管理方式。
1. 從數據出發
不要試圖“靠感覺”判斷軟件使用情況,而是引導企業建立數據驅動的許可管理機制。這包括軟件使用日志、用戶行為分析、設備利用率等因素。
2. 引入第三方工具
像gofarlic這樣的工具,大大提高許可管理的效率。決策者考慮引入這類軟件許可優化平臺,幫助企業在不降低服務質量的前提下,實現成本壓縮。
3. 培養“許可意識”
很多時候,員工和管理層并不理解軟件許可背后的成本邏輯。內部培訓和案例分享,提高全員對軟件授權的理解,這樣你在實施優化策略時,就會得到更多支持。
4. 設立專項小組
設立一個“軟件許可優化”專項小組,專門負責分析數據、制定策略和跟蹤執行效果。團隊成員包括IT、財務、法務等多個部門,確保優化方案既合法又高效。
六、結語:降維打擊的本質是“理性決策”
競爭對手的成本比你低,也許不是因為他們更便宜,而是因為他們更聰明、更理性。gofarlic軟件許可優化正是一種“降維打擊”的策略,它幫助企業從粗放式的授權管理,轉向精細化、動態化的資源配置模式。
在2025年,企業信息化程度的加深,軟件授權優化已經成為一項必須掌握的技能。如果你是政策制定者,希望在不增加預算的前提下提高企業運作效率,那么gofarlic可能是一個值得嘗試的工具。
別再讓軟件許可成為你成本控制的“拖油瓶”,而是讓它成為你優化資源配置、提高企業競爭力的利器。
展開 
巖土界有哪些降維打擊?
一六年以后,無人機測量技術慢慢普及,這門技術不需要人跑桿了,也不需要人用全站儀了,甚至不需要人畫圖了,飛機一過啥都有了,我的工作還有沒有和我以前多么努力的立桿已經沒有關系了,哪怕現在松手后棱鏡桿能十秒不倒,一切都沒有用了,也許這就是降維打擊吧。
巖土界有哪些降維打擊?
一六年以后,無人機測量技術慢慢普及,這門技術不需要人跑桿了,也不需要人用全站儀了,甚至不需要人畫圖了,飛機一過啥都有了,我的工作還有沒有和我以前多么努力的立桿已經沒有關系了,哪怕現在松手后棱鏡桿能十秒不倒,一切都沒有用了,也許這就是降維打擊吧。
【技術】DTEmpower核心功能技術揭秘(3) - HDDV高維數據可視化技術
圖2 HDDV高維數據可視化參數配置界面,用戶可以按照需求選擇繪制變量、繪制維數、降維算法和數據變換等參數,操作流程清晰
基于DTEmpower的HDDV高維數據集可視化建模實驗
1. 實驗測試
使用某測試數據集進行測試,該數據集的設計參數為x1、x2、x3,目標參數為y,有效維度為4(x1, x2, x3, y),通過設置不同的降維算法和不同的繪制維數,可以得到相應的可視化圖像及結論。
圖3 “降維算法=PCA,繪制維數=1”的箱形圖,發現數據集中存在少量離群點,正常數據集中分布在lower與upper之間,50%的數據分布在Q1到Q3之間
圖4 “降維算法=PCA,繪制維數=2”的散點聯合圖,可發現橫軸上數據分布并不滿足正態分布,說明數據集存在一定的非高斯模式
圖5 “降維算法=PCA,繪制維數=3”的3D可視化展示圖,可以發現數據集存在略為明顯的“稠密-稀疏”兩類數據分布模式
圖6 “降維算法=isomap,繪制維數=3”的3D可視化展示圖,可發現降維后數據集存在較為明顯的“稠密-稀疏”兩類不同模式
圖7 “降維算法=tSNE,繪制維數=3”的3D可視化展示圖,相比于線性降維方法,非線性降維方法可以發現數據集中兩種不同的子類模式,這時推薦用戶使用DTEmpower的HierarchicalStratify技術對數據進行訓練
2. 實驗結果分析
從上述實驗得出的可視化圖像,我們可以發現通過嘗試線性或非線性的不同算法、不同可視化維度,DTEmpower軟件中的HDDV高維數據可視化功能模塊可將抽象的數據轉換成直觀、美觀的圖像。
展開 面向CAE分析的CAD模型轉換研究
2.1 CAD三維實體模型的簡化
盡管目前大型有限元分析軟件都提供了與CAD軟件的接口, 但在多數情況下, CAD的模型往往不適合直接用于有限元分析, 需要對CAD三維實體降維、對稱化以進行模型簡化及修改。
2.1.1 模型的降維
降維就是要用具有高維實體屬性的低維實體表示高維實體。降維處理的目的是在滿足分析要求的情況下, 減少求解方程的個數, 縮短計算時間。其中, 可以用具有厚度的平面或曲面表示薄板, 如在機床床身靜剛度分析中, 通過用具有一定厚度的二維單元(shell單元)來模擬床身壁和床身結構中的筋板。也可用具有截面性質的直線表示一塊狹長的區域。在對圖2所示的軸類零件的撓度進行分析時, 可用桿梁單元來代替具有復雜幾何特征的模型進行降維。
降維處理主要涉及到以下幾個方面:降維特征的表示;特征降維的分析判斷;降維特征與原型特征的映射關系;特征降維的非流形性等。
2.1.2 對稱模型的簡化
在建立有限元分析模型時, 對于具有幾何對稱性的物體, 可以取其一部分進行分析, 得到的分析結果可以推廣到整個實物模型。如圖3 所示的錨具錨固性能分析。CAD模型中的特征為判別幾何對稱性提供了有利條件, 可以直接從模型特征的高層語義信息對幾何形狀進行對稱性識別。例如對于光軸這個概念, 從其特征定義可以知道它是幾何軸對稱的, 而不需要通過檢查低層的幾何元素是否對稱來判斷整體的對稱性。對于不能從高層語義信息進行幾何對稱性判斷的情況, 再從模型特征的低層次幾何信息(包括點、線、面以及特征的生成方式)進行對稱性判斷。
展開 基于新型高維代理模型的高效全局氣動優化設計
二
研究亮點
1)
針對飛行器氣動外形精細化設計帶來的高維變量需求,提出了基于核主成分分析(KPCA)的監督式非線性降維代理建模(SN-DRSM)方法,解決了當前線性降維方法或非監督式降維方法應用在DRSM中精度差,穩定性低的難題,以及HDMR等高維代理建模方法訓練花費高的問題,有效緩解了當前代理模型遭遇的“維度災難”難題。
SN-DRSM (也叫KPCA-Kriging)方法核心部分執行一個嵌套優化循環:外循環優化KPCA降維模型參數(如KPCA核函數參數以及特征空間有效維數等),使預測誤差盡可能小,直至收斂,其中在每次降維分析后向Kriging模型輸入降維后的數據;內循環接收KPCA降維后的樣本輸入優化代理模型參數,直至輸出最優代理模型并輸出預測值。這里預測誤差使用leave-One-Out Cross-Validation (LOOCV) error (
)誤差評定標準,以減少高可信度樣本CFD分析時間,詳細流程如圖1所示。
圖1 基于KPCA的監督式非線性降維代理建模流程圖
如圖2至圖4所示,在高維各個輸入變量維度下KPCA-Kriging方法交叉驗證誤差明顯小于Kriging方法和PCA-Kriging得到的預測誤差。而PCA-Kriging模型相對于Kriging模型并沒有顯著優勢,以至于其在優化設計中難以被使用。尤其Kriging方法在設計變量維數大于118后預測精度急劇變差;而KPCA-Kriging方法此時預測精度仍然保持在一個可接受的范圍內,并且預測誤差明顯小于Kriging方法和PCA-Kriging的預測誤差。
展開 【技術】基于DTEmpower的水處理系統參數預測 - 內因篇
圖4 MDI-重要性分析
⑥ 將輸入數據進行降維。數據降維節點提供了線性降維算法PCA和非線性降維算法isomap等15種降維算法。
⑦ 劃分模型的測試集和訓練集。
⑧ 使用不同算法對訓練集進行訓練。本次實驗使用了 GBDT(Gradient Boosting Decision Tree)、Bagging、隨機森林(Random Forest, RF)和極端隨機樹(ExtraTrees)4種非線性回歸算法。
⑨ 使用測試集對模型進行評估和對比。圖2中的模型對比控件可以得到不同模型的預測指標,如R2、RMSE、MAPE等,并提供了模型下載和保存和數據可視化功能。
圖5 真實值和預測值的對比
4. 實驗結果和分析
通過以上模型對累計流量、濁度、壓差等6個參數變量進行t+12h的長窗預測,實驗結果如表1所示。表中定性精度用來表示任意兩個預測值的大小關系與對應的實際值大小關系一致的概率。
表1 參數預測實驗結果
通過表1可以發現:
A. 基于內因的參數預測方法可以對多介質過濾器累計流量、多介質入口母管濁度和超濾壓差進行較準確的預測,R2準確率均超過了0.90;
B. 基于內因的參數預測方法對反滲透出口電導率和超濾出口濁度預測
的R2準確率不足0.70
,需要對樣本集或數據集進行其他方面的探索和嘗試。
總結
通過機器學習的方法可以有效的對水處理系統的部分參數進行長窗預測,DTEmpower軟件平臺提供了數據建模流程中特征提取、特征選擇和模型訓練一站式的解決方案,為客戶提供了使用簡單、功能強大的實驗平臺。
展開 前沿觀察|發揮比較優勢,讓AI更好賦能CAE
降維:深度學習與數值模擬的異同
CAE技術的模擬對象通常是復雜的物理場系統,因此建模首要考慮的是如何降維或如何抓住主要特征。以CFD(計算流體力學)為例,如果直接進行數值模擬,需要的網格量是雷諾數的9/4次方,而汽車、航空領域大部分工程問題的雷諾數都超過100萬,面對如此龐大的計算需求,即便是最先進的超級計算機也難以勝任。
傳統CAE技術主要是建立在數值計算框架上的模擬技術,其本質是將系統進行時空離散,并在局部采用理想化的“第一性原理”進行建模。時空離散的截斷是主要的降維手段,同時也是誤差產生的主要來源。針對特定場景,數值模擬方法中還存在其他的降維技術。在空間維度上,可以采用分辨率自適應技術,根據區域特性應用不同分辨率,或通過擬合函數自適應選擇與區域特性相匹配的函數進行空間擬合等。在時間維度上,時間步長自適應技術可以根據模擬過程的動態特性調整步長。這些方法使得數值模擬在保持結果精確的同時,有效減少了計算資源的消耗。
對于深度學習而言,通常包含一定的神經網絡規模和結構,例如參數數量,網絡層數及各層的鏈接關系等,而網絡參數的數量對于所建模的系統的自由度而言則小得多。深度神經網絡近似一個“黑盒”,因此無法確切知道深度神經網絡降維方式,但也給我們留下了充分的想象空間。理論上,深度學習模型具備在不同維度空間進行分解、變換和組合的能力,在訓練過程中可能對數據進行壓縮,提煉出不同角度的共性知識。然而,深度學習在仿真中也存在一些局限性,不可解釋性可能成為需要高度可靠性和透明度的工程應用中的一個問題。此外,深度學習模型可能會遇到過擬合的風險,特別是在數據量有限或數據分布不均勻的情況下。深度學習模型的訓練和推理過程需要消耗大量的計算資源,包括時間成本和能源成本,而數值模擬則不需要這種額外的消耗。
展開 
【DTEmpower案例操作教程】向導式建模
圖10 向導式中的兩個訓練等級
6)特征工程配置
特征工
程配置包
括特征處理、異常點清理、敏感性分析、數據降維和數據變換。
本案例中通過特征處理將模型的輸入變量設置為V1~V15,輸出變量設置為EQV1,如圖
11
所示。
圖11 特征處理示意圖
如圖12所示,本案例中異常點清理比例配置為5%,并設置快速粗篩的異常點識別等級。
圖12 異常點清理配置
敏感性分析可使用戶選擇對目標變量重要性最大的若干個特征進行后續的建模,如圖13所示,本案例中選擇了重要性最大的5個、8個和12個特征。
圖13 敏感性分析配置
數據降維是特征選擇后對輸入數據的進一步壓縮提純,如圖14所示,本案例開啟數據降維后選擇線性降維的方法,并指定累計貢獻率作為降維的標準,對輸入特征進行壓縮。
圖14 數據降維配置
數據降維后可進行數據變換的配置,如圖15所示,本案例分別對輸入變量和輸出變量進行Z-score和Robust變換。
圖15 數據變換配置
7)模型配置
模型配置包括訓練測試集劃分、算法選擇、精度指標和優化配置4部分內容。本案例中的訓練測試集來自同一份數據集,因此數據集來源選擇基于同一數據集拆分,測試集占比配置為默認的25%。
圖16 訓練/測試集配置
訓練算法選擇默認的基礎線性回歸和梯度提升決策樹兩種算法,精度指標和優化配置都選用默認配置。配置完成之后點擊保存按鈕。
8)模型訓練和結果查看
建模流程配置完成之后點擊訓練按鈕,如圖17,即可開始模型的訓練。
圖1
7
開啟模型訓練
模型訓練完成之后,向導式建模會以圖表的形式向用戶展示模型的評價指標。
展開 【篇三】生物醫藥領域發文難?(CADD、ROSETTA、多組學)一區SCI墊腳石已備好!
高維組學數據的預處理框架
常用數據預處理方法:缺失值填補,標準化,歸一化,對數轉化
常用的降維方法,PCA,tSNE等
數據探索分析(EDA)
2 案例實踐教學二:利用Python讀取組學CSV數據并進行數據探索可視化分析(Exploratory data analysis,EDA)
經典機器學習模型及多組學應用 目標:對在多組學整合分析中最常使用的幾種機器學習模型進行介紹,總結它們的優缺點及適用范圍,通過動手實踐快速掌握幾種方法
線性模型(線性回歸、梯度下降、正則化、回歸的評價指標)
決策樹(決策樹原理、ID3算法、C4.5算法、CART算法)
支持向量機(線性支持向量機、可分、不可分支持向量機)
集成學習(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法)
模型選擇與性能優化(數據清洗、特征工程、數據建模)
Scikit-learn機器學習庫的使用
2 案例實踐三:基于轉錄組學數據進行端到端的機器學習項目泛癌預測(數據預處理,數據建模,模型評估)
2 案例實踐四:基于蛋白組學-代謝組學在COVID-19中生物標志物的發現
深度學習在組學數據的應用 (入門及實踐) 目標:隨著高通量組學平臺的發展,生物醫學研究大多采取了多組學技術結合的方法,不同組學來源(如轉錄組學、蛋白質組學和代謝組學)的數據可以通過基于深度學習的預測算法進行整合,以揭示系統生物學的復雜工作。在這一部分我們會重點對基于深度學習的神經網絡進行系統的講解,學習常見的神經網絡架構在多組學分析的應用。
? 深度學習介紹,常用神經網絡架構介紹? 監督學習介紹,神經網絡在轉錄組學+代謝組學的疾病預測為例
? 無監督學習介紹,高維組學數據降維,聚類分析,以單細胞轉錄組數據為例
2 案例實踐五:基于t-SNE和UMAP進行單細胞轉錄組學數據降維,細胞亞型聚類分析。
展開 集成多組學數據的機器學習在生物醫學中的應用
? 深度學習介紹,常用神經網絡架構介紹? 監督學習介紹,神經網絡在轉錄組學+代謝組學的疾病預測為例
? 無監督學習介紹,高維組學數據降維,聚類分析,以單細胞轉錄組數據為例
2 案例實踐五:基于t-SNE和UMAP進行單細胞轉錄組學數據降維,細胞亞型聚類分析。
進階大綱
多組學聯合分析,闡明疾病分子機制 (入門及實戰)
背景:研究影響疾病表型變化影響的因素包括DNA,RNA,蛋白質和代謝物等。單一組學的數據難以系統全面地解析復雜生理過程的調控機制,多組學聯合分析通過對來自基因組、轉錄組、蛋白組、代謝組和脂質組等不同生物分子層次的批量數據進行歸一化處理、比較分析和相關性分析等統計學分析,建立不同層次分子間的數據關系,從而共同探究生物體內潛在的調控網絡機制,為生物體作用機制提供了更多證據。
目標:從常見的多組學聯合分析策略出發,如轉錄組+代謝組,蛋白組+代謝組等,對常用的數理統計分析方法進行介紹,之后學習如何利用數據庫如KEGG等進行生物功能富集分析,結合機器學習方法進行生物標志物的挖掘,疾病預測以及生物分子作用機制等。
展開 寫一個支持鴻蒙的理由
本以為以安卓的強勢地位 ,捏死華為手機,猶如二向箔降維打擊,舉手之勞。哪成想,華為祭出鴻蒙,立刻就受億萬人擁護。這才明白,原來天下苦美系操作系統久矣。
要是操作系統格局已定,一點沒有夸張。縱觀操作系統歷史,一旦格局已定,后來者基本沒有翻身的可能。在pc時代,微軟和蘋果占了98%以上份額。其中,微軟更是高達92.55%。來到移動互聯網時代,安卓和蘋果占了90%以上份額,其中安卓獨占71.6%,是當之無愧的霸主。
為什么后來者難有機會?因為后來者挑戰的不是操作系統本身,而是整個生態。上千萬的開發者靠這個生態吃飯。據統計,安卓開發者2000萬,iOS開發者2400萬。后來者讓這些人放棄現在吃飯的家伙,花費成本,學習新系統,談何容易。
正因如此,Google才以為依靠自己強大的地位,滅華為如探囊取物。在它看來,這就是操作系統廠家對一家普通手機公司的降維打擊。然而它忘了,當新時代來臨時,舊時代的王者往往跟不上時代。微軟推出的手機操作系統以慘敗收場。這次被降維打擊的,卻可能是Google自己。
全球智能手機銷量連續4年下滑,意味著一個舊時代正在落幕。
而Google參與圍獵華為,則加劇了自己被取代的速度。Google趕上了智能手機的暴發,但是它卻靠自己的傲慢和霸凌,催生出萬物互聯時代的新王者。
@半導體觀察 看來,移動互聯網時代被萬物互聯時代取代,要遠遠比移動互聯網取代pc來得更血腥。至少,手機并沒有完全取代pc。而到了萬物互聯時代,手機難道還需要一個和其它設備完全不同的操作系統嗎?
鴻蒙系統目標遠大,很可能是未來大部分智能設備的靈魂。安卓的掘墓人?那只是兼職。
天降大任必然是勞其筋骨,餓其體膚。鴻蒙問世以來,就少不了嘲笑,謾罵,懷疑,栽贓。然而,這些都沒有用。我們中國人受美帝的鳥氣已經夠多了。
展開