集成學習-Adaboost

Adaboost 中文名叫自適應提升算法,是一種boosting算法。

?

boosting算法的基本思想

對于一個復雜任務來說,單個專家的決策過于片面,需要集合多個專家的決策得到最終的決策,通俗講就是三個臭皮匠頂個諸葛亮。

對于給定的數據集,學習到一個較弱的分類器比學習到一個強分類器容易的多,boosting就是從弱學習器出發,反復學習,得到多個弱分類器,最后將這些弱分類器組合成強分類器。

?

boosting算法需要解決兩個問題

每一輪如何改變訓練樣本的權重

如何將弱分類器組合成強分類器

?

adaboost是這樣做的

1. 提高那些被前一輪弱分類器錯誤分類的樣本的權值,而降低那些被正確分類樣本的權值.,這樣下個分類器就能專注于那些不好識別的樣本,針對性的建立分類器。

2. 對于若分類器的組合,adaboost采取加權多數表決的方式,即加大分類錯誤率較小的弱分類器的權值,使其在表決中起較大作用,減小分類錯誤率較高的弱分類器的權值,使其在表決中起較小作用,

這可以理解為有些專家比較權威,他的意見要多采納,有些只是不知名的專家,可以少采納。

?

adaboost其實是一個加法模型,損失函數是指數損失函數,學習算法為前向分步算法的二分類學習方法。(其他學習算法如梯度下降)

加法模型

xgboost中其實也是加法模型,應該說boosting算法都是加法模型,而且還有很多算法也是加法模型,那什么是加法模型?

顧名思義,一個模型是由多個模型相加而得

那最終問題轉化為基于加法模型的損失最小化,即

通常這是一個十分復雜的優化問題,想要一步到位非常困難,如用梯度下降,所以就有了前向分步算法。

?

前向分步算法

前向分步算法是一種優化算法,可以解決上面加法模型的問題。

大致思路是,從前向后,每一步學習一個基分類器,使得整體損失函數更小一點,從而逐步逼近全局最小值。

?

算法流程

?

解釋一點: 新的學習器fm是在上個學習器fm-1的基礎上學習的,也就是說在學習fm時fm-1已經確定,所以求L(y, fm)的極小值就是求b(x;r)的極小值,即單個學習器的最小值。

實際上這和梯度下降的思路十分相似,每次減小一點,逼近一點,而且形式也一樣 fm=fm-1+βb

?

adaboost算法流程

?

?

?

誤差解釋

1. 誤差計算時除以了Σw,因為每輪迭代時,Σw是一個固定值,而且后面會說明其實它等于1,所以不用除這個。

2. 誤差計算時,分類正確為0,其權重被忽略,分類錯誤為1,其權重累加,所以是I(G!=y)

分類器權重解釋

權重更新解釋

組合分類器解釋

sign函數只能取1和-1,故adaboost為二分類。

當然可以通過修改實現多分類。

?

adaboost有很多種算法,但都大同小異,而且adaboost可以做回歸,思路也是大同小異,具體請百度

?

adaboost進階

正則化

adaboost每個學習器都是弱學習器,為什么還要正則化?其實不是正則化基學習器

fm=fm-1+αb(x,r),這是加法模型,α為基學習器的系數,可以理解為權重,

正則化是對加法模型增加一個學習率v,即fm=fm-1+vαb(x,r),這種方法適合于很多集成學習。

?

基分類器隨機化

像隨機森林一樣,隨機選特征,隨機選樣本

?

總結

理論上來講,adaboost的弱學習器可以是任何模型,但用的最多的是決策樹和神經網絡,決策樹是cart樹

優點:精度高,不容易過擬合

缺點:對異常值敏感,因為異常值可能獲得較大權重,最終影響整個模型

?

?

參考資料:

https://www.cnblogs.com/liuwu265/p/4693113.html?ptvd

https://zhuanlan.zhihu.com/p/59751960

https://zhuanlan.zhihu.com/p/42915999

https://blog.csdn.net/hahaha_2017/article/details/79852363

https://blog.csdn.net/guyuealian/article/details/70995333  原理-實例-代碼(簡明易懂)

轉載于:https://www.cnblogs.com/yanshw/p/10631437.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/277905.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/277905.shtml
英文地址,請注明出處:http://en.pswp.cn/news/277905.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

主動給團隊或用戶安裝Teams App

在寫這篇文章的時候,這個新功能還處在 Public Review,這意味著可能(很小的可能性)這里寫的方法在正式發布前還會有一些改動。 之前有一些做teams app開發的朋友問過我,能不能主動給一個team或者一個用戶安裝一個指定的…

thinkphp5多級控制器是什么?怎么使用?

thinkphp5多級控制器是什么?怎么使用? 一、總結 1、多級控制器是讓控制器的級數變成多級,也就是controller目錄下可以新建其它目錄。 2、使用的話注意目錄下的控制的的命名空間(加上目錄名)(namespace app\…

給Teams消息附加圖片的三種方式

Teams消息支持三種不同的方式來添加圖片,這篇文章我們來一起看一下這三種方式。 Inline圖片 var imagePath Path.Combine(Environment.CurrentDirectory, "abc.png"); var imageData Convert.ToBase64String(File.ReadAllBytes(imagePath)); var image…

4月18日 MySQL學習

正式開始了數據庫的學習 昨天下好的MySQL 今天正式開始學習的,介紹了多種數據庫軟件,當然 學習的這個是開源的 免費的。 DBMS(數據庫管理系統)這就是我們學習的數據庫的軟件 數據庫分為關系型數據庫管理系統和非關系型數據庫管理系統(沒有深入的了解) 今…

企業數據湖構建之旅

摘要:隨著互聯網的發展,數據的規模和類型都呈現一個爆炸性的增長,對于這么多類型的數據,如何進行有效的管理和存儲,包括數據的分析,這是大家要面臨的一個問題。在武漢云棲大會上,阿里云高級產品…

用AzureFunction開發最簡單的Teams Bot

之前我有一篇文章講了如何在azure function上開發最簡單的outgoing webhook,收到一些反饋,建議我介紹一下如果在azure function上開發teams bot,那這篇文章就來講一下如何用function來快速開發bot。 我們先創建一個azure function資源&#…

20189215 2018-2019-2 《密碼與安全新技術專題》第7周作業

課程:《密碼與安全新技術專題》 班級: 1892班 姓名: 李煬 學號:20189215 上課教師:謝四江 上課日期:2019年4月9日 必修/選修: 選修 1.本次講座的學習總結 講座主題:信息隱藏 信息隱藏…

BZOJ1565[NOI2009]植物大戰僵尸——最大權閉合子圖+拓撲排序

題目描述 Plants vs. Zombies(PVZ)是最近十分風靡的一款小游戲。Plants(植物)和Zombies(僵尸)是游戲的主角,其中Plants防守,而Zombies進攻。該款游戲包含多種不同的挑戰系列&#xf…

推送ActivityFeed到Teams

幾個月前,Teams 團隊又推出了新的 Graph API,讓 app 可以給用戶發送 Activity Feed。我們來看看如何做。 首先,我們的app需要使用較新的 manifest 1.7版本,當然如果使用最新的1.8版本就更好了。在manifest json中添加 webApplica…

RecycleView彈性滑動

還有點bug,建議使用 LinearSnapHelper rvPilotList.addOnScrollListener(new RecyclerView.OnScrollListener() {Overridepublic void onScrolled(NonNull RecyclerView recyclerView, int dx, int dy) {super.onScrolled(recyclerView, dx, dy);// …

關于深度學習,這些知識點你需要了解一下

深度學習概述 o 受限玻爾茲曼機和深度信念網絡 o Dropout o 處理不平衡的技巧 o SMOTE:合成少數過采樣技術 o 神經網絡中對成本敏感的學習 深度學習概述 在2006年之前,訓練深度監督前饋神經網絡總是失敗的,其主要原因都是導致…

發送不同類型的ActivityFeed

上一篇文章講到了如何使用最新的Graph API來給一個用戶發送一個簡單的 Activity Feed。我們這篇文章來詳細講一下發送三種不同類型的消息。 發送 Chat 相關的 Activity Notification API 為 POST https://graph.microsoft.com/beta/chats/{chat-id}/sendActivityNotification…

git add * 提示warning: LF will be replaced by CRLF in 解決辦法

在使用git的時候,每次執行 $ git add * 都會提示這樣一個警告消息: 雖然說沒有什么影響吧。 不過就是覺得太礙眼了, 按照這樣設置就沒有問題了: git config core.autocrlf false 這樣設置git的配置后在執行add操作就沒有問題了。 奮斗的年紀你…

git 放棄本地修改,強制拉取更新

開發時,對于本地的項目中修改不做保存操作(或代碼改崩),可以用到Git pull的強制覆蓋,具體代碼如下: git fetch --all git reset --hard origin/master git pull //可以省略 git fetch 指令是下載遠程倉庫最…

發送ActivityFeed的隱藏功能

前兩篇文章介紹了如何發送 activity notification,這篇文章主要介紹兩個隱藏功能,實際上所謂的隱藏功能是指大家在閱讀官方文檔是會忽略的兩個點,但是實際上也是很實用的兩個功能點。 text 類型的 topic 之前文章中提到我們的 activity not…

Dispatch Queue 之 Invoke 當前隊列

 轉載于:https://www.cnblogs.com/huahuahu/p/dispatch-queue-zhi-invoke-dang-qian-dui-lie.html

js或jQuery獲取當前屏幕的各種高度

Javascript: 網頁可見區域寬: document.body.clientWidth 網頁可見區域高: document.body.clientHeight 網頁可見區域寬: document.body.offsetWidth (包括邊線的寬) 網頁可見區域高: document.body.offsetHeight (包括邊線的高) …

Teams數據統計 - 用戶在線離線狀態

前幾天我在wechat的moments里看到以為朋友發了騰迅會議的對用戶個人的年度數據統計,看上去很有大數據感。 實際上 Teams 也具備的類似的能力,只是它把這個能力開放給了開發人員,我們可以通過強大的 Graph API,獲取大量的數據信息&…

我們是如何通過全球第一免費開源ERP Odoo做到項目100%交付

傳統友商ERP的交付過程 一、先初步需求調研,后選型功能模塊 傳統友商ERP第一件事情先對客戶方進行初步的調研,客戶方無論說什么,友商聽過算過,只關心你人數多少,有哪些人涉及到哪些模塊,接著對模塊進行所謂…

HDU 4747 Mex

4747 思路: 線段樹 先求出mex(1,1), mex(1, 2) , mex(1,3),...,mex(1,n)(單調上升),先將這些mex放進線段樹里求和 然后再求出next[i]表示下一次出現a[i] 的位置 然后從前…