集成方法-概念理解

集成方法(ensemble method)又叫元算法(meta-algorithm):將不同的分類器組合起來。

通俗的說:就是三個臭皮匠賽過諸葛亮。做決定時,考慮多個人的意見,不是一個人的意見

集成方法:

  1. bagging(自舉匯聚法):基于數據隨機重抽樣的分類器構建方法。并行算法

  2. boosting(再學習):基于所有分類器的加權求和的方法。? ? ? ? ? ? ? 串行算法。

bagging:從原始數據集選擇S次后得到S個新數據集的一種技術。新數據集和原數據集的大小相等。

其實就是有放回采樣,獲得一個和原來大小一樣的新數據集。這個新數據集可能會有重復值,原始數據集的某些值在新數據集中可能不在出現。

用這樣的方法構建S個新的數據集參與訓練,就會得到S個分類器。測試新數據時,送到S個分類器里,得到的結果投票,數量最多的就是分類結果(得民心者得天下)。

boosting:串行訓練。第一個訓練完,第二個在第一個的基礎上接著訓練。重點關注前面分類器錯分的數據(說白了就是背鍋俠,前面哥們犯的錯,后面的去解決)。

目前 bagging 方法最流行的版本是: 隨機森林(random forest)
選男友:美女選擇擇偶對象的時候,會問幾個閨蜜的建議,最后選擇一個綜合得分最高的一個作為男朋友

目前 boosting 方法最流行的版本是: AdaBoost
追女友:3個帥哥追同一個美女,第1個帥哥失敗->(傳授經驗:姓名、家庭情況) 第2個帥哥失敗->(傳授經驗:興趣愛好、性格特點) 第3個帥哥成功

bagging和boosting共同點和差異點:

  1. bagging 是一種與 boosting 很類似的技術, 無論是boosting還是bagging,所使用的多個分類器的類型(數據量和特征量)都是一致的(就是說要用KNN,都用KNN,要用決策樹,那就都用決策樹)。
  2. bagging 是由不同的分類器(1.數據隨機化 2.特征隨機化)經過訓練,綜合得出的出現最多分類結果;boosting 是通過調整已有分類器錯分的那些數據來獲得新的分類器,得出目前最優的結果。
  3. bagging 中的分類器權重是相等的;而 boosting 中的分類器加權求和,所以權重并不相等,每個權重代表的是其對應分類器在上一輪迭代中的成功度。(就是說bagging投票是一人一票,權重相等。而boosting權重不等,可能有的權重大,有的權重小)

?

?

轉載于:https://www.cnblogs.com/gezhuangzhuang/p/10004304.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/276835.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/276835.shtml
英文地址,請注明出處:http://en.pswp.cn/news/276835.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

單片機按鍵防抖程序_這些單片機按鍵設計方案,請拿好,不謝!

在單片機系統里,按鍵是常見的輸入設備,在本文中介紹幾種按鍵硬件、軟件設計方面的技巧。一般的在按鍵的設計上,一般有四種方案,創客學院帶你零基礎學習電子產品設計。一是GPIO口直接檢測單個按鍵,如圖1.1所示;二是按鍵…

Oracle 11G 安裝詳解

oracle官網下載地址:http://www.oracle.com/technetwork/database/enterprise-edition/downloads/index.html 官網下載需要注冊orcale賬號,比較繁瑣,這里直接放已經下載好的安裝包鏈接 Oracle11G下載鏈接: https://pan.baidu.com/s/1v6oD4jAt…

程序員何苦為難程序員?

有時候想想程序員為何為難程序員呢? 扳扳手指走上碼農這個行業也有幾年了,但是越來越覺得這個行業很累,有人說程序員就是二代農民工,我個人還是比較贊同的,對于剛入道的同仁們來說確實就是個體力(腦力,眼力…

kubeadm部署k8s_用 kubeadm 部署生產級 k8s 集群

概述kubeadm 已?持集群部署,且在1.13 版本中 GA,?持多 master,多 etcd 集群化部署,它也是官?最為推薦的部署?式,?來是由它的 sig 組來推進的,?來 kubeadm 在很多??確實很好的利?了 kubernetes 的許…

poj 題目分類

1000 AB Problem 送分題 1001 Exponentiation 高精度 1003 Hangover 送分題 1004 Financial Management 送分題 1005 I Think I Need a Houseboat 幾何 1006 Biorhythms 送分題 1007 …

模板的語法

我已經碰到過好幾次這種錯誤了. template<typename R>static_inline vec4<typename R::scalar>point(constrhs2<R>&v) { returnvec4<P>(v.x, v.y, 0, 1); } template<typename R>static_inline vec4<typename R::sca…

統計學習方法概論---分類問題

為什么80%的碼農都做不了架構師&#xff1f;>>> 分類問題 轉載于:https://my.oschina.net/liyangke/blog/2945185

IEPLUS(IE增強性插件)

用Vista好長好長時間了&#xff0c;除了比較吃硬件、老的游戲不兼容、我350W像素的老羅技不能用等等&#xff0c;感覺不是非常不錯的。IE 7也還可以&#xff0c;后來我試用了傲游、火狐&#xff0c;在多標簽后傲游的一些操作更人性化&#xff0c;我最喜歡它的托拉即可自動出新標…

CENTOS7 Python3.7 PyAudio 安裝

2019獨角獸企業重金招聘Python工程師標準>>> 出現錯誤: gcc -pthread -Wno-unused-result -Wsign-compare -DNDEBUG -g -fwrapv -O3 -Wall -fPIC -fPIC -I/usr/local/python371/include/python3.7m -c src/_portaudiomodule.c -o build/temp.linux-aarch64-3.7/src/…

bash for循環_Bash 中的 For 循環

循環是編程語言的基本概念之一。當你想要一遍又一遍地運行一系列命令直到達到某個條件后終止退出時&#xff0c;循環很方便。在諸如 Bash 之類的腳本語言中&#xff0c;循環對于自動執行重復性任務非常有用。在 Bash 腳本中有3個基本的循環結構&#xff0c;for 循環&#xff0c…

Atlas Unknown Error

if("using Atlas" and "there are some js codes in HEAD tag") then "Unknown Error" solution: copy the js codes to other position 轉載于:https://www.cnblogs.com/JoeHou/archive/2009/02/03/1383231.html

軟件工程師的6年總結

“又是一年畢業時”&#xff0c;看到一批批學子離開人生的象牙塔&#xff0c;走上各自的工作崗位&#xff1b;想想自己也曾經意氣風發、躊躇滿志&#xff0c;不覺感嘆萬千……本文是自己工作6年的經歷沉淀或者經驗提煉&#xff0c;希望對所有的軟件工程師們有所幫助&#xff0c…

linux 信號_Linux的信號和線程

Linux的信號和線程-Tech Talk 讓技術發出聲音?www.ttalk.im什么是線程線程&#xff0c;有時被稱為輕量級進程(Lightweight Process&#xff0c;LWP&#xff09;&#xff0c;是程序執行流的最小單元。一個標準的線程由線程ID&#xff0c;當前指令指針(PC&#xff09;&#xff0…

tomcat部署教程

參考博客地址&#xff1a; https://blog.csdn.net/xiaoyu940601/article/details/54950673轉載于:https://www.cnblogs.com/liuniublogs/p/10019068.html

選擇文字就能選擇復選框

更方便的單選框下面為腳本顯示區  看看下面的選擇框&#xff0c;似乎沒有什么不同的。微妙之處在于&#xff0c;選擇項目時不必非得在框內點擊鼠標了&#xff0c;在文本上選擇即可。不信試一試吧。 經常來這里 偶爾來看看 轉載于:https://www.cnblogs.com/leevane/archive/200…

python 數據結構

一. 深入鏈表 先來介紹一些鏈表具備的一些常用方法&#xff1a; append(x) : 把一個元素添加到鏈表的結尾 extend(L) : 將另外一個鏈表合并到該鏈表中 insert(i,x) : 插入一個元素到指定位置的前面 remove(x) : 刪除鏈表中第一個值為x的元素 如果沒有這樣的元素 則返回錯誤 pop…

python筆試編程題_Python——面試編程題

一、python----輸出1-100之和的方法 方法一&#xff1a; print(sum(range(1,101))) 方法二&#xff1a; from functools import reduce print(reduce(lambda x, y: xy, range(101))) 方法三: t0 for i in range(101): ti print(t) 方法四&#xff1a; print(sum([x for x in ra…

go語言項目優化(經驗之談)

1 Go的應用場景 在斗魚我們將GO的應用場景分為以下三類&#xff0c;緩存類型數據&#xff0c;實時類型數據&#xff0c;CPU密集型任務。這三類應用場景都有著各自的特點。 ● 緩存類型數據在斗魚的案例就是我們的首頁&#xff0c;列表頁&#xff0c;這些頁面和接口的特點是不同…

AddTransient、AddSingleton、AddScoped 三者都應該在什么場景下使用

網上隨便一搜&#xff0c;能搜出一大堆對三者進行區別分析的文章&#xff0c;但是呢&#xff0c;理論是一回事&#xff0c;實際使用又是另外一回事&#xff0c;到底在何種場景下應該使用何種注入方式呢&#xff1f; 通過這篇文章和我自身的實際經驗&#xff0c;來說一說實際應用…