【DTEmpower案例操作教程】向?qū)浇?


DTEmpower是由天洑軟件自主研發(fā)的一款通用的智能數(shù)據(jù)建模軟件,致力于幫助工程師及工科專業(yè)學(xué)生,利用工業(yè)領(lǐng)域中的仿真、試驗(yàn)、測(cè)量等各類數(shù)據(jù)進(jìn)行挖掘分析,建立高質(zhì)量的數(shù)據(jù)模型,實(shí)現(xiàn)快速設(shè)計(jì)評(píng)估、實(shí)時(shí)仿真預(yù)測(cè)、系統(tǒng)參數(shù)預(yù)警、設(shè)備狀態(tài)監(jiān)測(cè)等工程應(yīng)用。軟件內(nèi)置有圖形化、零編碼的數(shù)據(jù)分析建模環(huán)境,圍繞數(shù)據(jù)清理、特征生成、敏感性分析和模型訓(xùn)練等環(huán)節(jié)提供豐富的AI算法,提供從模型搭建到模型管理應(yīng)用的一站式解決方案,學(xué)習(xí)門檻低、模型質(zhì)量高,零基礎(chǔ)用戶也能快速挖掘得到優(yōu)秀的數(shù)據(jù)模型。
案例描述 

圖形化的建模方法需要通過(guò)節(jié)點(diǎn)拖拽的方式搭建建模流程,并且通常需要對(duì)單個(gè)建模節(jié)點(diǎn)的參數(shù)進(jìn)行多次調(diào)試,重復(fù)運(yùn)行。與圖形化建模方式不同的是,向?qū)浇DJ(rèn)配置一套完整的建模流程供用戶使用,并且支持對(duì)流程中多個(gè)節(jié)點(diǎn)參數(shù)一鍵式的組合調(diào)試,非常便于用戶開(kāi)展數(shù)據(jù)分析和建模工作。
本案例中的數(shù)據(jù)集為某風(fēng)機(jī)制造廠商提供的結(jié)構(gòu)應(yīng)力評(píng)估數(shù)據(jù)集,目標(biāo)是快速評(píng)估測(cè)點(diǎn)的結(jié)構(gòu)應(yīng)力。數(shù)據(jù)集中包含15維輸入(V1~V15)和27維輸出(EQV1~EQV27),以其中兩個(gè)輸出為例通過(guò)向?qū)浇=⑤斎胼敵鲋g的回歸映射模型。
操作流程 

1)新建項(xiàng)目

雙擊打開(kāi)DTEmpower軟件,即可進(jìn)入到如圖1所示的界面。單擊新建項(xiàng)目,即可創(chuàng)建一個(gè)臨時(shí)項(xiàng)目文件,需要注意的是,臨時(shí)創(chuàng)建的項(xiàng)目文件不會(huì)自動(dòng)保存。如果想要保存項(xiàng)目文件,用戶可以進(jìn)入到項(xiàng)目中選擇“文件-保存”,就可以保存工程文件到自己想要的指定位置。

【DTEmpower案例操作教程】向?qū)浇5膱D11 新建項(xiàng)目

2)添加數(shù)據(jù)集 

新建項(xiàng)目之后,即會(huì)進(jìn)入到DTEmpower的工程主頁(yè)面,如圖2所示。

【DTEmpower案例操作教程】向?qū)浇5膱D2

圖2 工程主頁(yè)

 進(jìn)入工程主頁(yè)之后,點(diǎn)擊“導(dǎo)入數(shù)據(jù)”,即跳出數(shù)據(jù)集文件上傳窗口。點(diǎn)擊窗口中的“選擇文件”按鈕,即可選擇本地磁盤中的數(shù)據(jù)文件加載至當(dāng)前項(xiàng)目中,如圖3所示。

【DTEmpower案例操作教程】向?qū)浇5膱D3
3 上傳原始數(shù)據(jù)

數(shù)據(jù)集添加完成后即出現(xiàn)在左側(cè)的資源菜單中,如圖4所示。

【DTEmpower案例操作教程】向?qū)浇5膱D4
圖4 數(shù)據(jù)集上傳結(jié)果
3)搭建向?qū)浇A鞒?/span>

通過(guò)數(shù)據(jù)視圖右上方的“數(shù)據(jù)建模”按鈕,進(jìn)入向?qū)浇5娜肟冢鐖D5所示。

【DTEmpower案例操作教程】向?qū)浇5膱D5

圖5  向?qū)浇H肟?/span>

彈出數(shù)據(jù)建模窗口后,在向?qū)J街羞x擇風(fēng)力機(jī)強(qiáng)度數(shù)據(jù)集,目標(biāo)變量設(shè)置為EQV1,并用回歸訓(xùn)練的方式擬合目標(biāo)變量和輸入變量的映射關(guān)系,如圖6所示。

【DTEmpower案例操作教程】向?qū)浇5膱D6
圖6  向?qū)浇H肟谂渲?/span>
配置好向?qū)J胶簏c(diǎn)擊確定按鈕就完成了向?qū)浇5牧鞒檀罱ǎ鐖D7所示。

【DTEmpower案例操作教程】向?qū)浇5膱D7

圖7  向?qū)浇A鞒檀罱ㄍ瓿?/span>
4)建模流程配置

在開(kāi)始模型訓(xùn)練之前用戶可以自由配置建模流程中的各個(gè)環(huán)節(jié),如圖8所示,點(diǎn)擊配置按鈕,即可進(jìn)入向?qū)浇5牧鞒膛渲谩?/span>

【DTEmpower案例操作教程】向?qū)浇5膱D8
圖8 向?qū)浇A鞒膛渲萌肟?/span>
如圖9所示為向?qū)浇5呐渲妹姘澹ɑA(chǔ)配置、特征工程和模型配置三部分內(nèi)容。
【DTEmpower案例操作教程】向?qū)浇5膱D9
圖9  向?qū)浇A鞒膛渲妹姘?/span>
5)基礎(chǔ)配置
基礎(chǔ)配置包括建模模板、目標(biāo)變量和訓(xùn)練等級(jí)三部分。其中建模模板為向?qū)浇H肟谂渲脮r(shí)所設(shè)定,在設(shè)置目標(biāo)變量時(shí)可以添加新的變量或刪除已設(shè)置的變量。并且向?qū)浇L峁┝藘蓚€(gè)訓(xùn)練等級(jí),為方便起見(jiàn),本案例中選擇快速的模型訓(xùn)練方式。

【DTEmpower案例操作教程】向?qū)浇5膱D10

圖10 向?qū)街械膬蓚€(gè)訓(xùn)練等級(jí)

6)特征工程配置
特征工 程配置包 括特征處理、異常點(diǎn)清理、敏感性分析、數(shù)據(jù)降維和數(shù)據(jù)變換。 本案例中通過(guò)特征處理將模型的輸入變量設(shè)置為V1~V15,輸出變量設(shè)置為EQV1,如圖 11 所示。
【DTEmpower案例操作教程】向?qū)浇5膱D11
圖11 特征處理示意圖

如圖12所示,本案例中異常點(diǎn)清理比例配置為5%,并設(shè)置快速粗篩的異常點(diǎn)識(shí)別等級(jí)。

【DTEmpower案例操作教程】向?qū)浇5膱D12

圖12 異常點(diǎn)清理配置

敏感性分析可使用戶選擇對(duì)目標(biāo)變量重要性最大的若干個(gè)特征進(jìn)行后續(xù)的建模,如圖13所示,本案例中選擇了重要性最大的5個(gè)、8個(gè)和12個(gè)特征。
【DTEmpower案例操作教程】向?qū)浇5膱D13

圖13 敏感性分析配置

數(shù)據(jù)降維是特征選擇后對(duì)輸入數(shù)據(jù)的進(jìn)一步壓縮提純,如圖14所示,本案例開(kāi)啟數(shù)據(jù)降維后選擇線性降維的方法,并指定累計(jì)貢獻(xiàn)率作為降維的標(biāo)準(zhǔn),對(duì)輸入特征進(jìn)行壓縮。

【DTEmpower案例操作教程】向?qū)浇5膱D14
圖14 數(shù)據(jù)降維配置

數(shù)據(jù)降維后可進(jìn)行數(shù)據(jù)變換的配置,如圖15所示,本案例分別對(duì)輸入變量和輸出變量進(jìn)行Z-score和Robust變換。

【DTEmpower案例操作教程】向?qū)浇5膱D15

圖15 數(shù)據(jù)變換配置

7)模型配置

模型配置包括訓(xùn)練測(cè)試集劃分、算法選擇、精度指標(biāo)和優(yōu)化配置4部分內(nèi)容。本案例中的訓(xùn)練測(cè)試集來(lái)自同一份數(shù)據(jù)集,因此數(shù)據(jù)集來(lái)源選擇基于同一數(shù)據(jù)集拆分,測(cè)試集占比配置為默認(rèn)的25%。

【DTEmpower案例操作教程】向?qū)浇5膱D16

圖16 訓(xùn)練/測(cè)試集配置

訓(xùn)練算法選擇默認(rèn)的基礎(chǔ)線性回歸和梯度提升決策樹(shù)兩種算法,精度指標(biāo)和優(yōu)化配置都選用默認(rèn)配置。配置完成之后點(diǎn)擊保存按鈕。

8)模型訓(xùn)練和結(jié)果查看

建模流程配置完成之后點(diǎn)擊訓(xùn)練按鈕,如圖17,即可開(kāi)始模型的訓(xùn)練。

【DTEmpower案例操作教程】向?qū)浇5膱D17
圖1 7   開(kāi)啟模型訓(xùn)練

模型訓(xùn)練完成之后,向?qū)浇?huì)以圖表的形式向用戶展示模型的評(píng)價(jià)指標(biāo)。如圖18展示了EQV1目標(biāo)變量的建模評(píng)價(jià)結(jié)果,線性回歸模型的R2指標(biāo)在0.2左右,而GBDT模型的R2指標(biāo)在0.4左右,說(shuō)明適合用非線性模型建立EQV1目標(biāo)變量和輸入變量之間的映射關(guān)系。

【DTEmpower案例操作教程】向?qū)浇5膱D18

圖18 查看建模結(jié)果

至此,已經(jīng)完成了向?qū)浇5牧鞒檀罱ê湍P陀?xùn)練,后續(xù)可通過(guò)優(yōu)化配置等選項(xiàng)進(jìn)一步提高模型精度。

DTEmpower更多詳細(xì)介紹及軟件試用,請(qǐng)點(diǎn)擊DTEmpower - 智能數(shù)據(jù)建模軟件,前往查閱。試用無(wú)需申請(qǐng)license,下載軟件安裝后可直接免費(fèi)試用30天。

登錄后免費(fèi)查看全文
立即登錄
App下載
技術(shù)鄰APP
工程師必備
  • 項(xiàng)目客服
  • 培訓(xùn)客服
  • 平臺(tái)客服

TOP