DM集成學(xué)習(xí)的示例分析

小編給大家分享一下DM集成學(xué)習(xí)的示例分析，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

創(chuàng)新互聯(lián)建站是一家專業(yè)提供亞東企業(yè)網(wǎng)站建設(shè),專注與網(wǎng)站設(shè)計制作、成都網(wǎng)站建設(shè)、H5頁面制作、小程序制作等業(yè)務(wù)。10年已為亞東眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)的建站公司優(yōu)惠進(jìn)行中。

在解決分類問題時，假如分類模型不夠強(qiáng)大，對樣本的分類結(jié)果就不會很理想。這時如果我們多找一些分類模型，讓它們一起做決策，模型強(qiáng)度會不會高一點呢？

集成學(xué)習(xí)就是把多種分類器按策略組合起來，并根據(jù)所有分類器的分類結(jié)果做出最后的判斷。

如下圖，三種分類器的分類結(jié)果都有一點點錯誤，如果把三類組合在一起就可以完美地把所有形狀都區(qū)分開，而且分割曲線也較為平滑。

DM集成學(xué)習(xí)的示例分析

集成學(xué)習(xí)屬于監(jiān)督學(xué)習(xí)中的分類問題，分為boosting和bagging兩大類。

DM集成學(xué)習(xí)的示例分析

一、Bagging

如何得到不同的分類器呢？我們可以調(diào)整同一訓(xùn)練模型的不同參數(shù)，或者使用不同的訓(xùn)練樣本訓(xùn)練不同的模型。

有放回的采樣(Bootstrap Samples)：

每次拿出一個小球，記錄之后放回。這樣既保留了數(shù)據(jù)規(guī)律，又得到了不同的訓(xùn)練樣本。

DM集成學(xué)習(xí)的示例分析

Bagging算法框架如下圖：

DM集成學(xué)習(xí)的示例分析

根據(jù)有放回采樣(選出F%的樣本)訓(xùn)練出T個分類器，分別對測試樣本進(jìn)行分類，然后投票決定測試樣本到底屬于哪類。

DM集成學(xué)習(xí)的示例分析

少數(shù)服從多數(shù)，所有分類器的地位完全等同。

二、基于決策樹的Bagging：RandomForests，RF

n個樣本，有放回的取出n個樣本，取n次。當(dāng)n趨近于無窮的時候，大概有2/3的樣本被選過。

DM集成學(xué)習(xí)的示例分析

剩下的1/3(out of bag,OOB)正好可以去做測試。

隨機(jī)森林：

DM集成學(xué)習(xí)的示例分析

樹的數(shù)量為500較為合適（滿足要求即可）。為了生成不同的樹，首先對樣本用有放回的采樣隨機(jī)選取出樣本，使用不同的屬性對樹進(jìn)行分層。

樣本屬性數(shù)量，我們隨機(jī)選取 DM集成學(xué)習(xí)的示例分析個屬性對樹進(jìn)行劃分。這樣可以有效加快樹的建立過程。

三、Boosting

Boosting中分類器的生成過程并不是平行的，下一個分類器的生成是根據(jù)上一個分類器中分類對錯情況來決定的。

DM集成學(xué)習(xí)的示例分析

而且在boosting中又增加了一個分類器，把所有子分類器的輸出當(dāng)作該判別器的輸入，而且對每條輸入都設(shè)置了權(quán)重。分類器對權(quán)重進(jìn)行訓(xùn)練、學(xué)習(xí)后得到分類結(jié)果。

Boosting框架如下圖所示：

DM集成學(xué)習(xí)的示例分析

Boosting偽代碼：

DM集成學(xué)習(xí)的示例分析

四、Adaboost

Adaboost算法是boosting中的一個門類，算法思想與boosting一致。可以證明，adaboost的誤差上界會隨著訓(xùn)練的進(jìn)行而越來越小。

Adaboost算法框架如下：

DM集成學(xué)習(xí)的示例分析

D1(i)表示每個樣本的權(quán)重，如果某些樣本之前被分錯了，它們的Dt+1(i)就會增大，之后分類器對這些樣本劃分時就會越關(guān)注。

DM集成學(xué)習(xí)的示例分析表示樣本訓(xùn)練誤差。由生成，同時也表示每個分類器的權(quán)重。

DM集成學(xué)習(xí)的示例分析

Adaboost算法中的參數(shù)設(shè)置很少，訓(xùn)練過程幾乎全靠數(shù)據(jù)驅(qū)動。而且隨著迭代代數(shù)的增加，訓(xùn)練并不會出現(xiàn)過擬合的情況。

但因為最終的分類結(jié)果由50（或更多）個分類模型組合得到，所以分類依據(jù)的可解釋性并不好。

如下圖為adaboost算法在matlab中的實現(xiàn)。將50個簡單的線性分類器組合起來，就能形成一條相對復(fù)雜的分割界面。

DM集成學(xué)習(xí)的示例分析

以上是“DM集成學(xué)習(xí)的示例分析”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對大家有所幫助，如果還想學(xué)習(xí)更多知識，歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道！

文章題目：DM集成學(xué)習(xí)的示例分析
網(wǎng)頁URL：http://www.chinadenli.net/article38/peijpp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供微信小程序、建站公司、網(wǎng)站營銷、電子商務(wù)、自適應(yīng)網(wǎng)站、網(wǎng)站內(nèi)鏈

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

DM集成學(xué)習(xí)的示例分析