不知火舞的被虐|伊人天伊人天天综合网|博洛尼亚天气|任你懆这里只有精品4|久久美日韩精品久久|掌中之物漫画免费阅读观看|0丨d老妇

決策樹的案例

大數(shù)據(jù)——決策(decision tree)
大數(shù)據(jù)————決策樹(decision tree) 決策樹(decision tree):是一種基本的分類與回歸方法,主要討論分類的決策樹。 在分類問題中,表示基于特征對實例進行分類的過程,可以認為是if-then的集合,也可以認為是定義在特征空間與類空間上的條件概率分布。 決策樹通常有三個步驟:特征選擇、決策樹的生成、決策樹的修剪。 用決策樹分類:從根節(jié)點開始,對實例的某一特征進行測試,根據(jù)測試結(jié)果將實例分配到其子節(jié)點,此時每個子節(jié)點對應(yīng)著該特征的一個取值,如此遞歸的對實例進行測試并分配,直到到達葉節(jié)點,最后將實例分到葉節(jié)點的類中。 決策樹學(xué)習(xí)的目標:根據(jù)給定的訓(xùn)練數(shù)據(jù)集構(gòu)建一個決策樹模型,使它能夠?qū)嵗M行正確的分類。 決策樹學(xué)習(xí)的本質(zhì):從訓(xùn)練集中歸納出一組分類規(guī)則,或者說是由訓(xùn)練數(shù)據(jù)集估計條件概率模型。 決策樹學(xué)習(xí)的損失函數(shù):正則化的極大似然函數(shù) 決策樹學(xué)習(xí)的測試:最小化損失函數(shù) 決策樹學(xué)習(xí)的目標:在損失函數(shù)的意義下,選擇最優(yōu)決策樹的問題。 數(shù)據(jù)挖掘中決策樹是一種經(jīng)常要用到的技術(shù),可以用于分析數(shù)據(jù),同樣也可以用來作預(yù)測。一個決策樹包含三種類型的節(jié)點: 決策節(jié)點:通常用矩形框來表示 機會節(jié)點:通常用圓圈來表示 終結(jié)點:通常用三角形來表示 剪枝是決策樹停止分支的方法之一,剪枝有分預(yù)先剪枝和后剪枝兩種。預(yù)先剪枝是在的生長過程中設(shè)定一個指標,當達到該指標時就停止生長,這樣做容易產(chǎn)生“視界局限”,就是一旦停止分支,使得節(jié)點N成為葉節(jié)點,就斷絕了其后繼節(jié)點進行“好”的分支操作的任何可能性。不嚴格的說這些已停止的分支會誤導(dǎo)學(xué)習(xí)算法,導(dǎo)致產(chǎn)生的不純度降差最大的地方過分靠近根節(jié)點。后剪枝中首先要充分生長,直到葉節(jié)點都有最小的不純度值為止,因而可以克服“視界局限”。
展開
orange使用指南(決策
摘要:本文使用界面化機器學(xué)習(xí)編程工具orange,進行決策樹回歸。 01 概覽 說明: 1 訓(xùn)練集(包含特征集和標簽集) 2 決策樹 3 測試集(包含特征集和標簽集) 4 預(yù)測 5 得分
sklearn中決策的應(yīng)用(python)
摘要:本文使用決策樹進行分類,回歸。
XGBoost 工作原理詳解
XGBoost 工作原理詳解 傳統(tǒng)機器學(xué)習(xí)模型(如決策樹和隨機森林)易于解釋,但在復(fù)雜數(shù)據(jù)集上往往難以保證準確性。XGBoost(Extreme Gradient Boosting 的縮寫)是一種先進的機器學(xué)習(xí)算法,專為實現(xiàn)高效性、快速性和高性能而設(shè)計。 算法的演進 決策樹 → 集成方法(Bagging)→ 隨機森林 → 提升方法(Boosting)→ 梯度提升 → XGBoost XGBoost 是梯度提升的優(yōu)化實現(xiàn),屬于集成學(xué)習(xí)方法的一種,通過組合多個弱模型構(gòu)建出更強的模型。它以決策樹作為基礎(chǔ)學(xué)習(xí)器,通過順序組合這些決策樹來提升模型性能——每棵新都會針對前序的預(yù)測誤差進行訓(xùn)練,這一過程被稱為“提升”。XGBoost 內(nèi)置并行處理功能,可快速在大型數(shù)據(jù)集上訓(xùn)練模型,同時支持自定義設(shè)置,允許用戶根據(jù)具體問題調(diào)整模型參數(shù)以優(yōu)化性能。 XGBoost 工作流程 XGBoost 按順序構(gòu)建決策樹,每棵都試圖修正前序的錯誤,具體流程如下: 1. 初始化基礎(chǔ)學(xué)習(xí)器:訓(xùn)練第一棵決策樹作為初始模型。在回歸任務(wù)中,該基礎(chǔ)模型直接預(yù)測目標變量的平均值。 2. 計算預(yù)測誤差:第一棵訓(xùn)練完成后,計算預(yù)測值與實際值之間的誤差。 3. 訓(xùn)練下一棵決策樹:基于前序的誤差訓(xùn)練新,核心目標是修正前序的預(yù)測錯誤。 4. 迭代訓(xùn)練過程:重復(fù)上述步驟,每棵新均以修正前序的誤差為目標,直至滿足停止條件(如達到預(yù)設(shè)數(shù)量、誤差收斂等)。 5. 組合預(yù)測結(jié)果:最終預(yù)測值為所有決策樹預(yù)測結(jié)果的總和。 XGBoost 算法的數(shù)學(xué)原理 XGBoost 可視為一個迭代過程,初始預(yù)測值通常設(shè)為 0,之后通過不斷添加決策樹來降低誤差。其數(shù)學(xué)表達如下: 1.
展開
決策樹圖1
機器學(xué)習(xí)模型的集成方法總結(jié):Bagging, Boosting, Stacking, Voting, Blending
它由大量的決策樹組成,這些決策樹作為一個整體運行。它使用Bagging和特征隨機性的概念來創(chuàng)建每棵獨立的。每棵決策樹都是從數(shù)據(jù)中隨機抽取樣本進行訓(xùn)練。在隨機森林中,我們最終得到的不僅接受不同數(shù)據(jù)集的訓(xùn)練,而且使用不同的特征來預(yù)測結(jié)果。 Bagging通常有兩種類型——決策樹的集合(稱為隨機森林)和決策樹以外的模型的集合。兩者的工作原理相似,都使用聚合方法生成最終預(yù)測,唯一的區(qū)別是它們所基于的模型。在sklearn中,我們有一個BaggingClassifier類,用于創(chuàng)建除決策樹以外的模型。 Boosting 增強集成方法通過重視先前模型的錯誤,將弱學(xué)習(xí)者轉(zhuǎn)化為強學(xué)習(xí)者。Boosting以順序的方式實現(xiàn)同構(gòu)ML算法,每個模型都試圖通過減少前一個模型的誤差來提高整個過程的穩(wěn)定性。 在訓(xùn)練n+1模型時,數(shù)據(jù)集中的每個數(shù)據(jù)點都被賦予了相等的權(quán)重,這樣被模型n錯誤分類的樣本就能被賦予更多的權(quán)重(重要性)。誤差從n個學(xué)習(xí)者傳遞給n+1個學(xué)習(xí)者,每個學(xué)習(xí)者都試圖減少誤差。 ADA Boost是使用Boost生成預(yù)測的最基本模型之一。ADA boost創(chuàng)建一個決策樹樁森林(一個樹樁是一個只有一個節(jié)點和兩個葉子的決策樹),不像隨機森林創(chuàng)建整個決策樹森林。它給分類錯誤的樣本分配更高的權(quán)重,并繼續(xù)訓(xùn)練模型,直到得到較低的錯誤率。 Stacking Stacking也被稱為疊加泛化,是David H. Wolpert在1992年提出的集成技術(shù)的一種形式,目的是通過使用不同的泛化器來減少錯誤。 疊加模型利用來自多個基礎(chǔ)模型的預(yù)測來構(gòu)建元模型,用于生成最終的預(yù)測。堆疊模型由多層組成,其中每一層由幾個機器學(xué)習(xí)模型組成,這些模型的預(yù)測用于訓(xùn)練下一層模型。 在疊加過程中,將數(shù)據(jù)分為訓(xùn)練集和測試集兩部分。
展開
基于車輛運行數(shù)據(jù)的疲勞駕駛狀態(tài)檢測分析
從相關(guān)系數(shù)看來, 單個特征與疲勞駕駛的相關(guān)度不高. 2.4 疲勞駕駛識別(隨機森林) 隨機森林(Random Forest,RF) 是一種基于分類的集成學(xué)習(xí)算法, 由 Breiman于 2001 年提出 .隨機森林是由隨機子空間算法和裝袋算法集成的一種算法, 其基本原理是通過隨機采樣特征和樣本, 生成很多決策樹, 每一顆決策樹是不相關(guān)的,將多棵決策樹組合在一起就形成森林. 通過各決策樹進行投票決策, 最終選擇多數(shù)投票(Bagging)的策略來決定結(jié)果 . 具體的算法步驟如下: (1) 記原始訓(xùn)練集中有 M 個特征,樣本總數(shù)為N . 采用 Bootstrap抽樣技術(shù),從訓(xùn)練集中抽取 N 個樣本形成訓(xùn)練子集. (2) 隨 機 選 取 m 個 特 征 作 為 特 征 子 集( m≤M ), 從這 m 個特征中選擇最優(yōu)的切分點再做節(jié)點分裂, 直到節(jié)點的所有訓(xùn)練樣例都屬于同一類. 節(jié)點通常按基尼指數(shù)、信息增益率、均方差等規(guī)則分裂,且在分裂過程中完全分裂不剪枝. (3) 重復(fù)(1)、(2)步驟 k 次即可得到由 k 棵決策樹構(gòu)建而成的隨機森林. (4) 使用隨機森林進行決策. 若設(shè) x 代表測試樣本, k 代表決策樹數(shù)量, h i 代表單棵決策樹,i∈ { 1,…,k }, Y 代表輸出變量即分類標簽, I 為指示性函數(shù), H 為隨機森林模型,則決策公式 [16] 為 基于采集的車輛運行數(shù)據(jù)(檔位、速度、油門踏板開度、剎車踏板開度、時間等), 共提取了駕駛行為特征 18 項. 隨機森林在處理高維特征的樣本數(shù)據(jù)時, 通常能得到極好的準確率. 且在訓(xùn)練完之后,隨機森林能夠給出特征重要度的排名 . 隨機森林算法還具有很強的抗干擾能力 .
展開
大數(shù)據(jù)—人工智能領(lǐng)域高水平會議及熱點技術(shù)匯總
人工智能領(lǐng)域高水平會議及熱點技術(shù)匯總 源自:奇科技探索 更多信息可關(guān)注:人工智能技術(shù)與咨詢,(⒈⒐⒌???2??2??①⑤②) 安排 2022年11月24日-28日 線上直播 一、大數(shù)據(jù)概述 1.大數(shù)據(jù)及特點分析 2.大數(shù)據(jù)關(guān)健技術(shù) 3.大數(shù)據(jù)計算模式 4.大數(shù)據(jù)應(yīng)用實例 二、大數(shù)據(jù)處理架構(gòu)Hadoop 1.Hadoop項目結(jié)構(gòu) 2.Hadoop安裝與使用 3.Hadoop集群的部署與使用 4.Hadoop 代表性組件 三、分布式文件系統(tǒng)HDFS 1.HDFS體系結(jié)構(gòu) 2.HDFS存儲 3.HDFS數(shù)據(jù)讀寫過程 四、分布式數(shù)據(jù)庫HBase 1.HBase訪問接口 2.HBase數(shù)據(jù)類型 3.HBase實現(xiàn)原理 4.HBase運行機制 5.HBase應(yīng)用 五、MapReduce 1.MapReduce體系結(jié)構(gòu) 2.MapReduce工作流程 3.資源管理調(diào)度框架YARN 4.MapReduce應(yīng)用 六、Spark 1.Spark生態(tài)與運行架構(gòu) 2.Spark SQL 3.Spark部署與應(yīng)用方式 七、IPython Notebook運行Python Spark程序 1.Anaconda 2.IPython Notebook使用Spark 3.使用IPython Notebook在Hadoop YARN模式運行 八、Python Spark集成開發(fā)環(huán)境 1.Python Spark集成開發(fā)環(huán)境部署配置 2.Spark數(shù)據(jù)分析庫MLlib的開發(fā)部署 九、Python Spark決策樹二分類與多分類 1.決策樹原理 2.大數(shù)據(jù)問題 3.決策樹二分類
展開
數(shù)據(jù)分析與AI丨基于AI的電子元件焊接質(zhì)量優(yōu)化
wx_fmt=png"></p><p><br></p><p>由于根因分析要求解釋性會非常高,所以<strong>使用決策樹訓(xùn)練的模型能夠更加直觀的表示具體是什么原因?qū)е碌拇纹贰?lt;/strong>建模的過程可以使用 AI Studio 進行向?qū)降臉?gòu)建。</p><p><br></p><p class="ql-align-center"><img src="https://mmecoa.qpic.cn/mmecoa_png/x0yLiaf5fF6we33KOfMqBR2fiamEN1JtRSKjzAMbSI4mocTq9bEXxibfwDCejwbzv0n152lTH8ORnB3SUUkukdmicg/640?wx_fmt=png"></p><p><br></p><p>可以從下圖看到依據(jù)決策樹的拆分流程:</p><p><br></p><p class="ql-align-center"><img src="https://mmecoa.qpic.cn/mmecoa_png/x0yLiaf5fF6we33KOfMqBR2fiamEN1JtRSiaHl2iaXofrWDgcTPCpCLrffcpsILnWe9f61pNtQleNm7LJOXUIedFMQ/640?wx_fmt=png"></p><p><br></p><p>基于決策樹模型,可以<strong>直接識別出影響次品率的關(guān)鍵因素及其相應(yīng)的決策規(guī)則</strong>,從而為后續(xù)的工藝優(yōu)化提供明確的方向。</p><p><br></p><p>3、<strong>結(jié)論:次品率降低12%,生產(chǎn)效率提升10%</strong></p><p><br></p><p>通過安裝監(jiān)控系統(tǒng)和設(shè)置預(yù)警機制,及時調(diào)整工藝參數(shù)。
展開
關(guān)于“人工智能與機器學(xué)習(xí)”python-深度學(xué)習(xí)
1.熵、聯(lián)合熵、條件熵、KL散度、互信息(1)最大似然估計與最大熵模型 (2)ID3、C4.5、CART詳解 (3)決策樹的正則化 (4)預(yù)剪枝和后剪枝 (5)Bagging (6)隨機森林 (7)不平衡數(shù)據(jù)集的處理 (8)利用隨機森林做特征選擇 (9)使用隨機森林計算樣本相似度 (10)異常值檢測 代碼和案例實踐: 1.隨機森林與特征選擇 2.決策樹應(yīng)用于回歸 3.多標記的決策樹回歸 4.決策樹和隨機森林的可視化 5.葡萄酒數(shù)據(jù)集的決策樹/隨機森林分類 6.泰坦尼克乘客存活率估計 第 四 節(jié) SVM 1.線性可分支持向量機 (1)軟間隔 (2)損失函數(shù)的理解 (3)核函數(shù)的原理和選擇 (4)SMO算法 (5)支持向量回歸SVR (6)多分類SVM 代碼和案例實踐: 1.原始數(shù)據(jù)和特征提取 2.調(diào)用開源庫函數(shù)完成SVM 3.葡萄酒數(shù)據(jù)分類 4.數(shù)字圖像的手寫體識別 5.MNIST手寫體識別 6.SVR用于時間序列曲線預(yù)測 7.SVM、Logistic回歸、隨機森林三者的橫向比較 第 五 節(jié) 聚類算法 1.無監(jiān)督學(xué)習(xí)之聚類算法 (1)聚類的基本概念 (2)聚類的評價 (3)扁平聚類及 k-Means、k-Means++算法 (4)層次聚類及 HAC 算法 (5)其他聚類算法(DBSCAN/SOM/譜聚類) 代碼和案例實踐: 1.鳶尾花聚類分析 2.社交網(wǎng)絡(luò)人群分析 3.銀行客戶分組與畫像 第 六 節(jié)
展開
【1月16-18日 北京+線上】全國人工智能Python機器學(xué)習(xí)與深度學(xué)習(xí)實戰(zhàn)培訓(xùn)班
1.決策樹-信息熵,ID3,C4.5算法介紹 2.sklearn實現(xiàn)決策樹 3.決策樹-CART算法 4.CART算法實踐 5.決策樹解決線性二分類問題 6.決策樹解決非線性二分類問題 案例:葉子分類項目 案例:銀行用戶購買行為預(yù)測 九、集成算法與隨機森林 1.Bagging介紹與使用 2.隨機森林介紹與使用 3.Adaboost介紹與使用 4.Stacking和Voting介紹與使用 案例:用戶流失分析 十、K-means聚類算法 1.K-means算法介紹 2.K-means算法應(yīng)用 3.K-means算法實際應(yīng)用案例 案例:NBA球隊實力聚類分析 十一、支持向量機 1.SVM算法介紹與原理推導(dǎo) 2.支持向量的作用 3.核函數(shù)的作用 4.建模方法 案例:SVM完成人臉識別應(yīng)用 十二、特征工程項目 1.數(shù)據(jù)缺失處理 2.特征篩選方法 3.特征工程 4.算法選擇 5.結(jié)果評估 十三、深度學(xué)習(xí)基礎(chǔ)-神經(jīng)網(wǎng)絡(luò)介紹 1.人工神經(jīng)網(wǎng)絡(luò)發(fā)展史 2.單層感知器 3.激活函數(shù),損失函數(shù)和梯度下降法 4.BP算法介紹 案例:BP算法解決手寫數(shù)字識別問題 十四、Tensorflow基礎(chǔ)應(yīng)用 1.Tensorflow安裝 2.Tensorlfow基礎(chǔ)知識:圖,變量,fetch,feed 3.Tensorflow線性回歸 4.
展開
M-L 和 FEM 的數(shù)學(xué)聯(lián)系
還可以引入其它最優(yōu)解約束條件,Ridge回歸: Lasso回歸: ElasticNet回歸: Logistic(邏輯)回歸: or or Logistic回歸算法選擇: 03 決策樹的數(shù)學(xué)原理 1. 構(gòu)造表達式,比如: H可以有不同的表達式, gini: entropy: mean squared error: 2. 很顯然,上式無法求解待定系數(shù),所以額外引入最優(yōu)解約束條件: 然后就可以求解了。 04 樸素貝葉斯的數(shù)學(xué)原理 表面上看,樸素貝葉斯的數(shù)學(xué)原理在敘述上和上述思想有所不同,其實有同有不同: 根據(jù)貝葉斯定理: 得出最優(yōu)解約束條件: 這是我們首次提到,最優(yōu)解約束條件是有根據(jù)的;前文中,我們提到的線性模型,決策樹,都沒有闡述引入約束條件的根據(jù)。這是不同之處。 相同之處在: 1. 構(gòu)造表達式,比如 假設(shè)條件概率分布符合高斯分布: 假設(shè)條件概率分布符合多項式分布: 假設(shè)條件概率分布符合伯努利分布: 等等形式,不一一列舉。 2. 很顯然,上式無法求解待定系數(shù),所以額外引入最優(yōu)解約束條件: 05 K-NN的數(shù)學(xué)原理 表面上看,K-NN的數(shù)學(xué)原理和以上有所不同,其實有同有不同: 不同之處在于,沒有提及構(gòu)造表達式,其實最優(yōu)解約束條件已經(jīng)包含了構(gòu)造表達式。所以數(shù)學(xué)原理在思想還是一樣的。
展開
決策樹圖2
大數(shù)據(jù)建模、分析、挖掘技術(shù)
1.決策樹原理 2.大數(shù)據(jù)問題 3.決策樹二分類 4.決策樹多分類 1.搜集數(shù)據(jù) 2.數(shù)據(jù)準備:導(dǎo)入并轉(zhuǎn)換數(shù)據(jù)、提取特征字段、提取標簽 3.
17個機器學(xué)習(xí)的常用算法
決策樹學(xué)習(xí) 決策樹算法根據(jù)數(shù)據(jù)的屬性采用樹狀結(jié)構(gòu)建立決策模型, 決策樹模型常常用來解決分類和回歸問題。常見的算法包括:分類及回歸(Classification And Regression Tree, CART), ID3 (Iterative Dichotomiser 3), C4.5, Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 隨機森林(Random Forest), 多元自適應(yīng)回歸樣條(MARS)以及梯度推進機(Gradient Boosting Machine, GBM) 10. 貝葉斯方法貝葉斯方法算法是基于貝葉斯定理的一類算法,主要用來解決分類和回歸問題。常見算法包括:樸素貝葉斯算法,平均單依賴估計(Averaged One-Dependence Estimators, AODE),以及Bayesian Belief Network(BBN)。 11. 基于核的算法基于核的算法中最著名的莫過于支持向量機(SVM)了?;诤说乃惴ò演斎霐?shù)據(jù)映射到一個高階的向量空間, 在這些高階向量空間里, 有些分類或者回歸問題能夠更容易的解決。常見的基于核的算法包括:支持向量機(Support Vector Machine, SVM), 徑向基函數(shù)(Radial Basis Function ,RBF), 以及線性判別分析(Linear Discriminate Analysis ,LDA)等。 12.聚類算法聚類,就像回歸一樣,有時候人們描述的是一類問題,有時候描述的是一類算法。聚類算法通常按照中心點或者分層的方式對輸入數(shù)據(jù)進行歸并。所以的聚類算法都試圖找到數(shù)據(jù)的內(nèi)在結(jié)構(gòu),以便按照最大的共同點將數(shù)據(jù)進行歸類。
展開
《MATLAB工程數(shù)學(xué)——MATLAB實用指南系列》
目錄 第1篇 統(tǒng)計工具箱 第1章 統(tǒng)計工具箱簡介 第2章 概率論 第3章 樣本描述 第4章 方差分析 第5章 假設(shè)檢驗 第6章 回歸分析 第7章 非參數(shù)檢驗 第8章 多元方差分析 第9章 聚類分析 第10章 判別分析 第11章 主成分分析 第12章 因子分析 第13章 隱馬爾可夫模型 第14章 多維尺度分析 第15章 決策樹 第16章 統(tǒng)計過程控制 第17章 試驗設(shè)計 第18章 統(tǒng)計圖 第19章 文件輸入/輸出 第20章 統(tǒng)計演示 第2篇 優(yōu)化工具箱 第21章 優(yōu)化工具箱概述 第22章 無約束最優(yōu)化問題 第23章 有約束最優(yōu)化問題 第24章 二次規(guī)劃 第25章 0-1規(guī)劃 第26章 多目標規(guī)劃 第27章 最大最小化 第28章 半無限問題 第29章 最小二乘問題 第30章 方程求解 …… 第3篇 偏微分方程數(shù)值解工具箱 第4篇 樣條工具箱 第5篇 曲線擬合工具箱 參考文獻
展開
自動機器學(xué)習(xí)綜述
下面是auto-sklearn可以從決策樹、高斯樸素貝葉斯、梯度增強、kNN、LDA、SVM、隨機森林和線性分類器(SGD)中選擇的一些分類器。在預(yù)處理步驟上,它支持以下幾個方面:內(nèi)核主成分分析,選擇百分位數(shù),選擇率,一熱編碼,歸位,平衡,縮放,特征聚集,等等。同樣,從通過組合現(xiàn)有特性來豐富數(shù)據(jù)集的角度來看,這些都不能理解為特性工程步驟。 有些算法會自動地通過一系列不同的變量配置來優(yōu)化某些指標。這類似于尋找可變的重要性。通常,通過理解變量存在的上下文和域,人們可以很好地完成這項工作。例如:“夏季銷量增加”或“最昂貴的商品來自西倫敦居民”。這些變量可以由人類領(lǐng)域?qū)<易匀坏匕凳境鰜怼H欢?,還有另一種方法來理解一個變量的重要性,那就是看這個變量在統(tǒng)計上有多重要。這是由決策樹(使用所謂的基尼指數(shù)或信息增益)等算法自動完成的。隨機森林也這樣做,但與決策樹不同,隨機森林運行多個決策樹,以創(chuàng)建引入了隨機性的多個模型。 對于時間序列數(shù)據(jù),我們傾向于討論汽車。R中的arima包使用AIC作為優(yōu)化指標。自動生成的算法。arima在后臺使用Hyndman-Khandakar來實現(xiàn)這一點,在下面的OText書中有詳細的解釋。 如前所述,H2O無人駕駛AI可以用于自動化特征工程。它還可以用來自動訓(xùn)練多個算法在同一時間。這是由h2o實現(xiàn)的。automl包。它可以自動訓(xùn)練您的數(shù)據(jù)使用多種不同的算法與不同的參數(shù),如GLM, Xgboost隨機森林,深度學(xué)習(xí),集成模型,等等。 DataRobot還可以用于同時自動訓(xùn)練多個算法。這是通過使用經(jīng)DataRobot科學(xué)家調(diào)整過的模型實現(xiàn)的,因此能夠使用預(yù)先設(shè)置的超參數(shù)運行幾十個模型。它最終會選擇一個準確率最高的算法。
展開