集成學習-Adaboost

集成學習-Adaboost

news/2025/9/7 21:40:43/文章來源:https://blog.csdn.net/weixin_30868855/article/details/98897826

Adaboost 中文名叫自適應提升算法，是一種boosting算法。

?

boosting算法的基本思想

對于一個復雜任務來說，單個專家的決策過于片面，需要集合多個專家的決策得到最終的決策，通俗講就是三個臭皮匠頂個諸葛亮。

對于給定的數據集，學習到一個較弱的分類器比學習到一個強分類器容易的多，boosting就是從弱學習器出發，反復學習，得到多個弱分類器，最后將這些弱分類器組合成強分類器。

?

boosting算法需要解決兩個問題

每一輪如何改變訓練樣本的權重

如何將弱分類器組合成強分類器

?

adaboost是這樣做的

1. 提高那些被前一輪弱分類器錯誤分類的樣本的權值，而降低那些被正確分類樣本的權值.，這樣下個分類器就能專注于那些不好識別的樣本，針對性的建立分類器。

2. 對于若分類器的組合，adaboost采取加權多數表決的方式，即加大分類錯誤率較小的弱分類器的權值，使其在表決中起較大作用，減小分類錯誤率較高的弱分類器的權值，使其在表決中起較小作用，

這可以理解為有些專家比較權威，他的意見要多采納，有些只是不知名的專家，可以少采納。

?

adaboost其實是一個加法模型，損失函數是指數損失函數，學習算法為前向分步算法的二分類學習方法。（其他學習算法如梯度下降）

加法模型

xgboost中其實也是加法模型，應該說boosting算法都是加法模型，而且還有很多算法也是加法模型，那什么是加法模型？

顧名思義，一個模型是由多個模型相加而得

那最終問題轉化為基于加法模型的損失最小化，即

通常這是一個十分復雜的優化問題，想要一步到位非常困難，如用梯度下降，所以就有了前向分步算法。

?

前向分步算法

前向分步算法是一種優化算法，可以解決上面加法模型的問題。

大致思路是，從前向后，每一步學習一個基分類器，使得整體損失函數更小一點，從而逐步逼近全局最小值。

?

算法流程

?

解釋一點：新的學習器f_m是在上個學習器f_m-1的基礎上學習的，也就是說在學習f_m時f_m-1已經確定，所以求L(y, f_m)的極小值就是求b(x;r)的極小值，即單個學習器的最小值。

實際上這和梯度下降的思路十分相似，每次減小一點，逼近一點，而且形式也一樣 f_m=f_m-1+βb

?

adaboost算法流程

?

?

?

誤差解釋

1. 誤差計算時除以了Σw，因為每輪迭代時，Σw是一個固定值，而且后面會說明其實它等于1，所以不用除這個。

2. 誤差計算時，分類正確為0，其權重被忽略，分類錯誤為1，其權重累加，所以是I(G!=y)

分類器權重解釋

權重更新解釋

組合分類器解釋

sign函數只能取1和-1，故adaboost為二分類。

當然可以通過修改實現多分類。

?

adaboost有很多種算法，但都大同小異，而且adaboost可以做回歸，思路也是大同小異，具體請百度

?

adaboost進階

正則化

adaboost每個學習器都是弱學習器，為什么還要正則化？其實不是正則化基學習器

fm=fm-1+αb(x,r)，這是加法模型，α為基學習器的系數，可以理解為權重，

正則化是對加法模型增加一個學習率v，即fm=fm-1+vαb(x,r)，這種方法適合于很多集成學習。

?

基分類器隨機化

像隨機森林一樣，隨機選特征，隨機選樣本

?

總結

理論上來講，adaboost的弱學習器可以是任何模型，但用的最多的是決策樹和神經網絡，決策樹是cart樹

優點：精度高，不容易過擬合

缺點：對異常值敏感，因為異常值可能獲得較大權重，最終影響整個模型

?

?

參考資料：

https://www.cnblogs.com/liuwu265/p/4693113.html?ptvd

https://zhuanlan.zhihu.com/p/59751960

https://zhuanlan.zhihu.com/p/42915999

https://blog.csdn.net/hahaha_2017/article/details/79852363

https://blog.csdn.net/guyuealian/article/details/70995333　　原理-實例-代碼（簡明易懂）

轉載于:https://www.cnblogs.com/yanshw/p/10631437.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/277905.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/277905.shtml
英文地址，請注明出處：http://en.pswp.cn/news/277905.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

主動給團隊或用戶安裝Teams App

主動給團隊或用戶安裝Teams App

在寫這篇文章的時候，這個新功能還處在 Public Review，這意味著可能（很小的可能性）這里寫的方法在正式發布前還會有一些改動。之前有一些做teams app開發的朋友問過我，能不能主動給一個team或者一個用戶安裝一個指定的…

閱讀更多...

thinkphp5多級控制器是什么？怎么使用？

thinkphp5多級控制器是什么？怎么使用？

thinkphp5多級控制器是什么？怎么使用？ 一、總結 1、多級控制器是讓控制器的級數變成多級，也就是controller目錄下可以新建其它目錄。 2、使用的話注意目錄下的控制的的命名空間（加上目錄名）（namespace app\…

閱讀更多...

給Teams消息附加圖片的三種方式

給Teams消息附加圖片的三種方式

Teams消息支持三種不同的方式來添加圖片，這篇文章我們來一起看一下這三種方式。 Inline圖片 var imagePath Path.Combine(Environment.CurrentDirectory, "abc.png"); var imageData Convert.ToBase64String(File.ReadAllBytes(imagePath)); var image…

閱讀更多...

4月18日 MySQL學習

4月18日 MySQL學習

正式開始了數據庫的學習昨天下好的MySQL 今天正式開始學習的，介紹了多種數據庫軟件，當然學習的這個是開源的免費的。 DBMS(數據庫管理系統)這就是我們學習的數據庫的軟件數據庫分為關系型數據庫管理系統和非關系型數據庫管理系統(沒有深入的了解) 今…

閱讀更多...

企業數據湖構建之旅

企業數據湖構建之旅

摘要：隨著互聯網的發展，數據的規模和類型都呈現一個爆炸性的增長，對于這么多類型的數據，如何進行有效的管理和存儲，包括數據的分析，這是大家要面臨的一個問題。在武漢云棲大會上，阿里云高級產品…

閱讀更多...

用AzureFunction開發最簡單的Teams Bot

用AzureFunction開發最簡單的Teams Bot

之前我有一篇文章講了如何在azure function上開發最簡單的outgoing webhook，收到一些反饋，建議我介紹一下如果在azure function上開發teams bot，那這篇文章就來講一下如何用function來快速開發bot。我們先創建一個azure function資源&#…

閱讀更多...

20189215 2018-2019-2 《密碼與安全新技術專題》第7周作業

20189215 2018-2019-2 《密碼與安全新技術專題》第7周作業

課程：《密碼與安全新技術專題》班級： 1892班姓名： 李煬學號：20189215 上課教師：謝四江上課日期：2019年4月9日必修/選修： 選修 1.本次講座的學習總結講座主題：信息隱藏信息隱藏…

閱讀更多...

BZOJ1565[NOI2009]植物大戰僵尸——最大權閉合子圖+拓撲排序

BZOJ1565[NOI2009]植物大戰僵尸——最大權閉合子圖+拓撲排序

題目描述 Plants vs. Zombies（PVZ）是最近十分風靡的一款小游戲。Plants（植物）和Zombies（僵尸）是游戲的主角，其中Plants防守，而Zombies進攻。該款游戲包含多種不同的挑戰系列&#xf…

閱讀更多...

推送ActivityFeed到Teams

推送ActivityFeed到Teams

幾個月前，Teams 團隊又推出了新的 Graph API，讓 app 可以給用戶發送 Activity Feed。我們來看看如何做。首先，我們的app需要使用較新的 manifest 1.7版本，當然如果使用最新的1.8版本就更好了。在manifest json中添加 webApplica…

閱讀更多...

RecycleView彈性滑動

RecycleView彈性滑動

還有點bug，建議使用 LinearSnapHelper rvPilotList.addOnScrollListener(new RecyclerView.OnScrollListener() {Overridepublic void onScrolled(NonNull RecyclerView recyclerView, int dx, int dy) {super.onScrolled(recyclerView, dx, dy);// …

閱讀更多...

關于深度學習，這些知識點你需要了解一下

關于深度學習，這些知識點你需要了解一下

深度學習概述 o 受限玻爾茲曼機和深度信念網絡 o Dropout o 處理不平衡的技巧 o SMOTE：合成少數過采樣技術 o 神經網絡中對成本敏感的學習深度學習概述在2006年之前，訓練深度監督前饋神經網絡總是失敗的，其主要原因都是導致…

閱讀更多...

發送不同類型的ActivityFeed

發送不同類型的ActivityFeed

上一篇文章講到了如何使用最新的Graph API來給一個用戶發送一個簡單的 Activity Feed。我們這篇文章來詳細講一下發送三種不同類型的消息。發送 Chat 相關的 Activity Notification API 為 POST https://graph.microsoft.com/beta/chats/{chat-id}/sendActivityNotification…

閱讀更多...

git add * 提示warning: LF will be replaced by CRLF in 解決辦法

git add * 提示warning: LF will be replaced by CRLF in 解決辦法

在使用git的時候，每次執行 $ git add * 都會提示這樣一個警告消息： 雖然說沒有什么影響吧。不過就是覺得太礙眼了， 按照這樣設置就沒有問題了: git config core.autocrlf false 這樣設置git的配置后在執行add操作就沒有問題了。奮斗的年紀你…

閱讀更多...

git 放棄本地修改，強制拉取更新

git 放棄本地修改，強制拉取更新

開發時，對于本地的項目中修改不做保存操作（或代碼改崩），可以用到Git pull的強制覆蓋，具體代碼如下： git fetch --all git reset --hard origin/master git pull //可以省略 git fetch 指令是下載遠程倉庫最…

閱讀更多...

發送ActivityFeed的隱藏功能

發送ActivityFeed的隱藏功能

前兩篇文章介紹了如何發送 activity notification，這篇文章主要介紹兩個隱藏功能，實際上所謂的隱藏功能是指大家在閱讀官方文檔是會忽略的兩個點，但是實際上也是很實用的兩個功能點。 text 類型的 topic 之前文章中提到我們的 activity not…

閱讀更多...

Dispatch Queue 之 Invoke 當前隊列

Dispatch Queue 之 Invoke 當前隊列

 轉載于:https://www.cnblogs.com/huahuahu/p/dispatch-queue-zhi-invoke-dang-qian-dui-lie.html

閱讀更多...

js或jQuery獲取當前屏幕的各種高度

js或jQuery獲取當前屏幕的各種高度

Javascript: 網頁可見區域寬： document.body.clientWidth 網頁可見區域高： document.body.clientHeight 網頁可見區域寬： document.body.offsetWidth (包括邊線的寬) 網頁可見區域高： document.body.offsetHeight (包括邊線的高) …

閱讀更多...

Teams數據統計 - 用戶在線離線狀態

Teams數據統計 - 用戶在線離線狀態

前幾天我在wechat的moments里看到以為朋友發了騰迅會議的對用戶個人的年度數據統計，看上去很有大數據感。實際上 Teams 也具備的類似的能力，只是它把這個能力開放給了開發人員，我們可以通過強大的 Graph API，獲取大量的數據信息&…

閱讀更多...

我們是如何通過全球第一免費開源ERP Odoo做到項目100%交付

我們是如何通過全球第一免費開源ERP Odoo做到項目100%交付

傳統友商ERP的交付過程一、先初步需求調研，后選型功能模塊傳統友商ERP第一件事情先對客戶方進行初步的調研，客戶方無論說什么，友商聽過算過，只關心你人數多少，有哪些人涉及到哪些模塊，接著對模塊進行所謂…

閱讀更多...

HDU 4747 Mex

HDU 4747 Mex

4747 思路： 線段樹先求出mex(1,1)， mex(1, 2) ， mex(1,3)，...，mex(1，n)（單調上升），先將這些mex放進線段樹里求和然后再求出next[i]表示下一次出現a[i] 的位置然后從前…

閱讀更多...

最新文章