【技術】DTEmpower核心功能技術揭秘(6) - autoML超參優化技術


圖1 DTEmpower中每個算法節點都集成有超參優化功能,用戶只需要打開“超參優化”功能按鈕,即可在省去大量超參數調試過程的同時,獲取精度較高的模型
② 建模方法:根據圖2所示的建模流程,采用GBDT(Gradient Boosting Decision Tree)梯度提升樹算法進行模型訓練,分別在開啟和不開啟超參優化功能的條件下進行對比實驗。

圖2 基于DTEmpower軟件平臺的風機測點結構應力快速評估建模方案,選取了GBDT算法建立輸入輸出變量的映射關系。其中超參優化功能在算法節點的屬性配置界面,用戶只需點擊相應按鈕即可一鍵開啟或關閉超參優化功能,非常便于使用
③ 實驗分析:觀察超參優化功能的打開和關閉對最終模型的影響。圖3-1、3-2的實驗結果表明,僅開啟算法節點的超參優化功能,即可有效的提高模型精度,降低模型的預測誤差。

圖3-1 GBDT算法開啟超參優化和不開啟超參優化的預測值和真實值對比,可以看出開啟超參優化的算法預測值(圖中綠色折線)和真實值(紅色折線)總體上更加接近

圖3-2 GBDT算法在兩種情況下的預測誤差分布,誤差分布的提琴圖清晰的表明了開啟有超參優化的算法預測誤差分布更向0值靠攏。結合圖3-1充分說明了超參優化功能在提高模型精度、降低預測誤差方面的優越性
② 建模和實驗方法:采用圖4所示的建模流程,選取MDI+PCA作為降維工具,并使用GBDT和隨機森林2種算法用以訓練出口濁度預測模型。對每個算法節點分別開啟和關閉超參優化功能,觀察模型的精度變化。

圖4 基于DTEmpower軟件平臺的水處理系統參數長窗預測建模方案,方案中選取2種常見算法進行模型的訓練。DTEmpower提供了一站式的數據建模解決方案,通過簡單的節點拖拽即可搭建完整的建模流程,其中超參優化功能更是集成于每一個算法節點,能夠很方便的節省用戶的調參過程
③ 實驗分析:觀察超參優化功能的打開和關閉對最終模型的影響。圖5所示的實驗結果充分表明了超參優化對于提高模型精度的優越性。

數據和特征決定了模型的上限,要讓算法不斷逼近這個上限,需要調試大量的算法超參數。DTEmpower集成了低門檻的autoML超參優化功能,可以幫助用戶節省大量的調參過程。
通過實際工業場景中的應用案例和對比實驗,也證明了autoML功能模塊能輕松、有效尋找算法節點的最優超參數,可高效地輔助用戶構建高精度模型。
DTEmpower軟件平臺提供的數據挖掘、特征工程和模型自動學習等一站式解決方案,不僅可以幫助用戶快速、便捷地構建精度較高的數據模型,其技術的創新應用勢必會給工業數據研究者持續帶來福音。
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















