【DTEmpower案例操作教程】向?qū)浇?
1)新建項(xiàng)目
雙擊打開(kāi)DTEmpower軟件,即可進(jìn)入到如圖1所示的界面。單擊新建項(xiàng)目,即可創(chuàng)建一個(gè)臨時(shí)項(xiàng)目文件,需要注意的是,臨時(shí)創(chuàng)建的項(xiàng)目文件不會(huì)自動(dòng)保存。如果想要保存項(xiàng)目文件,用戶可以進(jìn)入到項(xiàng)目中選擇“文件-保存”,就可以保存工程文件到自己想要的指定位置。
圖1 新建項(xiàng)目
2)添加數(shù)據(jù)集
圖2 工程主頁(yè)
進(jìn)入工程主頁(yè)之后,點(diǎn)擊“導(dǎo)入數(shù)據(jù)”,即跳出數(shù)據(jù)集文件上傳窗口。點(diǎn)擊窗口中的“選擇文件”按鈕,即可選擇本地磁盤中的數(shù)據(jù)文件加載至當(dāng)前項(xiàng)目中,如圖3所示。
數(shù)據(jù)集添加完成后即出現(xiàn)在左側(cè)的資源菜單中,如圖4所示。
通過(guò)數(shù)據(jù)視圖右上方的“數(shù)據(jù)建模”按鈕,進(jìn)入向?qū)浇5娜肟冢鐖D5所示。
彈出數(shù)據(jù)建模窗口后,在向?qū)J街羞x擇風(fēng)力機(jī)強(qiáng)度數(shù)據(jù)集,目標(biāo)變量設(shè)置為EQV1,并用回歸訓(xùn)練的方式擬合目標(biāo)變量和輸入變量的映射關(guān)系,如圖6所示。
在開(kāi)始模型訓(xùn)練之前用戶可以自由配置建模流程中的各個(gè)環(huán)節(jié),如圖8所示,點(diǎn)擊配置按鈕,即可進(jìn)入向?qū)浇5牧鞒膛渲谩?/span>
圖10 向?qū)街械膬蓚€(gè)訓(xùn)練等級(jí)
如圖12所示,本案例中異常點(diǎn)清理比例配置為5%,并設(shè)置快速粗篩的異常點(diǎn)識(shí)別等級(jí)。
圖12 異常點(diǎn)清理配置
圖13 敏感性分析配置
數(shù)據(jù)降維是特征選擇后對(duì)輸入數(shù)據(jù)的進(jìn)一步壓縮提純,如圖14所示,本案例開(kāi)啟數(shù)據(jù)降維后選擇線性降維的方法,并指定累計(jì)貢獻(xiàn)率作為降維的標(biāo)準(zhǔn),對(duì)輸入特征進(jìn)行壓縮。
數(shù)據(jù)降維后可進(jìn)行數(shù)據(jù)變換的配置,如圖15所示,本案例分別對(duì)輸入變量和輸出變量進(jìn)行Z-score和Robust變換。
圖15 數(shù)據(jù)變換配置
7)模型配置
模型配置包括訓(xùn)練測(cè)試集劃分、算法選擇、精度指標(biāo)和優(yōu)化配置4部分內(nèi)容。本案例中的訓(xùn)練測(cè)試集來(lái)自同一份數(shù)據(jù)集,因此數(shù)據(jù)集來(lái)源選擇基于同一數(shù)據(jù)集拆分,測(cè)試集占比配置為默認(rèn)的25%。
圖16 訓(xùn)練/測(cè)試集配置
訓(xùn)練算法選擇默認(rèn)的基礎(chǔ)線性回歸和梯度提升決策樹(shù)兩種算法,精度指標(biāo)和優(yōu)化配置都選用默認(rèn)配置。配置完成之后點(diǎn)擊保存按鈕。
8)模型訓(xùn)練和結(jié)果查看
建模流程配置完成之后點(diǎn)擊訓(xùn)練按鈕,如圖17,即可開(kāi)始模型的訓(xùn)練。
模型訓(xùn)練完成之后,向?qū)浇?huì)以圖表的形式向用戶展示模型的評(píng)價(jià)指標(biāo)。如圖18展示了EQV1目標(biāo)變量的建模評(píng)價(jià)結(jié)果,線性回歸模型的R2指標(biāo)在0.2左右,而GBDT模型的R2指標(biāo)在0.4左右,說(shuō)明適合用非線性模型建立EQV1目標(biāo)變量和輸入變量之間的映射關(guān)系。
圖18 查看建模結(jié)果
DTEmpower更多詳細(xì)介紹及軟件試用,請(qǐng)點(diǎn)擊“DTEmpower - 智能數(shù)據(jù)建模軟件”,前往查閱。試用無(wú)需申請(qǐng)license,下載軟件安裝后可直接免費(fèi)試用30天。
工程師必備
- 項(xiàng)目客服
- 培訓(xùn)客服
- 平臺(tái)客服
TOP




















