集成算法學習bagging,boosting,stacking

baggibg(rf隨機森林)? adaboostibg

用來展示

Project Jupyter | Home

展示源碼

Eclipse IDE | The Eclipse Foundation

Eclipse 下載 |Eclipse 基金會

?

教程8-Adaboost決策邊界效果_嗶哩嗶哩_bilibili

(23 封私信) 圖解機器學習神器:Scikit-Learn - 知乎

?

Bagging:取平均

隨機森林是典型

?

?

?

隨機:隨機樣本采樣? 隨機特征采樣? 自己測試不同比例值

森林:并行訓練一對分類器(樹)? 多個樹加在一起去平均

多樣性

二重:數據隨機采樣--

?

?

先取100個樣本:? 80的部分1? 80的部分2

再取100個里面的10個:6個分到部分1? ?6個分到部分2 (不同特征值)

樹不一樣? 根節點有什么特征??

全在用樹模型:

?

?

什么特征上做了什么事

隨機森林:可解釋性強 自動的特征選擇

神經網絡:無法解釋? 輸入輸出可知? 處理未知

?

?

對B進行改變:? ? ?B丿? ? ? ? B丿丿

A,B,C,D類參數:如身高/體重....

error1? error2

e1≈e2? B沒用

e2>>e1? B有用

?

一些集成算法? 除了樹模型就不能再去集成了

?

?

Boosting:提升

?

隨機森林:總和求均

?

從100-預估950? ? ?剩下50中預估30? 剩下20中預估18

?

Adaboost:不斷切切? 讓數據有權重

?

stacking:堆疊算法

LR:邏輯回歸

DT:決策樹

RF:random forest隨機森林

?

?

stacking:堆疊算法? 不常用

?

第一步多種? ? 算法LR/DT/RTF得到多種輸出

第二步? 就選一種算法得到一種輸出

?

?

?

?

集成:3種

1.隨機森林式:并行

2.Boosting:提升? 一點一點去做? 234有關系??

3.stacking:

第一步多種????算法LR/DT/RTF得到多種輸出
第二步??就選一種算法得到一種輸出

?

集成算法思路:

軟投票:對概率加權平均

?

不認為類別:<0.5? ? ? 認為類別:>0.5

不想上課?

ABC:可能點名? D:非常可能會點名? ? soD? 會點名,去上課了

?

?

硬投票:只用結果

C∈2類? 2類太少? soC歸入1類

?

?

導入數據集selectio? ?split切分

?

加了一個alpha:突出程度

?

選算法+選類別值

?

找分類任務的投票器

?

?

?

?

?

?

clf分類器

軟投票:必須各個分類器都得到概率值

?

?

?

?

?

上面有bagging? 下面是沒有bagging

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

帶bagging的更好些

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

OOB:代辦數據 out of bag

加權平均

?

?

?

?

寫train 讓他們有屬性可以調用? 屬性里面有一個:特征多樣性

?

但上面X1,X2不好分辨


先實例化樹模型

.fit當前數據? 找到data? 找到標簽? .zip? 結合完當前對象? .feature

?

Importances后面有個杠

?

sklearn 做法

數據越重要:越前? 離根節點越近?

?

?

?

?

?

?

?

?

創建了MNIST? 做隨機森林? 看特征多樣性

_.shapes? ?784個點--每一個點的特征多樣性都可以算

?

畫熱度圖

熱度圖的圖像展示

展示當前圖像

指定顏色,默認顏色,

off去掉坐標軸

?

?

?

colorbar:深色代表什么? 淺色代表什么

?

?

?

boosting:串聯 一步步做

adaboost:調整權重-建模-調整權重-建模

像是整張試卷? 現在做錯題本? 對的題權重變小? 搓的題目權重變大

?

加權求和? 模型效果好--權重越大

?

?

?

?

對每個樣本進行權重賦值

邊畫圖邊展示? 畫12*4圖

不同調節力度對結果影響? 樣本權重(更新速度?)(更新幅度)

kernel--和函數? rbf:高斯和函數 C:軟間隔

實例化指定SVM的分類器clf

.fit一下(X_train,Y_train)

研究樣本的權重項為多少

預測當前結果來展示

!=? ?不等? ?就是做錯的? 權重放大=(1+學習率)

找到定義畫決策邊界的函數

?

?

?

?

boundary:對樣本權重進行更改

kernel:和函數 讓特征量變化演示結果更好

軟間隔

?

?

?

?

?

?

?

?

?

?

?

?adaboost:權重項不同? 集成算法對比

學習率:樣本函數衰減程度

多少輪

?

?

?提升策略:

GBDT梯度提升決策樹

種子 隨機進行數據集構建

?

?分別給預測結果 所有值加起來

?

?

?

?

?

?

?

?

?

?集成參數對比分析:

?

?拿到測試數據點

?

?

修改深度

?

?

?

1.0? ->? 0.1

?

沒有實際打印值

?

rate后面?{}

?

?

第二組對比實驗:

?

全部改成2

?

?

?

模型提前停止策略

?

.fit? xtrain實例化

?

?

停止方案實施:

?

?

?

?

?

?

?

?

?

設置上限 若連續5次都沒得到上升

?

stacking:堆疊集成

經過不同的算法(分類器)ABC

rf:隨機森林

?

數據集切分

116選擇不同分類器

?

?

?

?

?

?

?

?

?

?

?

1階段結果變成2階段特征

?

?

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/91900.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/91900.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/91900.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HOOPS SDK賦能PLM:打造全生命周期3D數據管理與協作能力

在制造業和工業領域&#xff0c;產品全生命周期管理&#xff08;PLM&#xff09; 已成為驅動企業數字化轉型、提升創新力與運營效率的核心引擎。一個高效的PLM平臺不僅需要管理海量的設計數據&#xff0c;還必須在設計、制造、供應鏈、銷售和服務等多個環節之間無縫流轉信息&am…

解決 Selenium 頁面跳轉過快導致的內容獲取問題:從原理到實踐

在使用 Selenium 進行網頁自動化操作時&#xff0c;很多開發者都會遇到一個頭疼的問題&#xff1a;頁面還沒加載完&#xff0c;代碼就已經執行到下一句了。結果要么是元素找不到&#xff0c;要么是獲取的內容不完整&#xff0c;甚至直接拋出異常。今天我們就來聊聊如何優雅地解…

【Python練習】051. 編寫一個函數,實現簡單的定時器功能

051. 編寫一個函數,實現簡單的定時器功能 051. 編寫一個函數,實現簡單的定時器功能 代碼說明: 示例運行: 擴展功能 代碼說明: 實現Python定時器的幾種方法 051. 編寫一個函數,實現簡單的定時器功能 以下是一個簡單的Python函數,用于實現定時器功能。這個定時器可以設置…

springboot基礎-demo

1.創建學生信息表 create table stu(id int unsigned primary key auto_increment comment ID,name varchar(100) comment 姓名,age tinyint unsigned comment 年齡,gender tinyint unsigned comment 性別, 1:男, 2:女,score double(5,2) comment 成績,phone varchar(11) comme…

關于transformer的一些疑點總結

殘差連接的作用 Transformer中的殘差連接&#xff08;Residual Connection&#xff09;是其深層架構能穩定訓練的核心設計之一&#xff0c;主要通過以下機制發揮作用&#xff1a; 1. 緩解梯度消失&#xff0c;支持深層訓練 梯度保護機制&#xff1a;在反向傳播時&#xff0c;…

【終極指南】解決 Windows 11 更新后 Docker 連接 localhost 奇慢(卡頓、超時十幾秒)的通用方案

聰明人能看得出這是 ai 寫的&#xff0c;但也是我親身實踐的&#xff0c;最后讓 ai 總結寫了一篇&#xff0c;放心食用 一、 結論先行&#xff08;直接用&#xff09;問題現象&#xff1a; 升級到某個 Windows 11 版本后&#xff0c;在本地訪問 Docker 容器中部署的任何服務&am…

Stream API

Java 8 引入的 Stream API 是處理集合數據的強大工具&#xff0c;它允許你以聲明式方式處理數據集合&#xff0c;支持各種聚合操作和并行處理。以下是 Stream API 的核心知識點及具體代碼示例&#xff1a; 1. Stream 概述 Stream 是數據渠道&#xff0c;用于操作數據源&#xf…

相機參數的格式與作用

在計算機視覺中&#xff0c;相機標定是非常重要的一步&#xff0c;主要目的是從圖像中恢復出物體的三維信息。為了做到這一點&#xff0c;我們需要了解和使用一系列的數學工具&#xff0c;這些工具描述了相機的成像過程&#xff0c;包括相機的內參、外參、畸變系數、投影矩陣和…

【jvm|基本原理】第四天

摘要&#xff1a;本文簡單分析了Java虛擬機的核心運行機制。首先介紹了基本數據類型在32位和64位虛擬機中的存儲差異&#xff0c;說明slot槽設計以空間換時間的優化思路。其次詳細解析了對象在堆內存中的存儲結構&#xff0c;包括對象頭、對象數據和對齊填充機制。然后探討了方…

Git高級操作與最佳實踐詳解

前言 熟練掌握Git的高級操作可以顯著提高開發效率&#xff0c;優化工作流程&#xff0c;解決復雜問題。本文將詳細介紹Git的高級操作技巧與最佳實踐&#xff0c;幫助開發者更加高效地管理代碼和協作開發。 1. 提交歷史管理 1.1 修改最近的提交 # 修改最近的提交信息 git co…

ElasticSearch:商品SKU+SPU實現join查詢,設計及優化

文章目錄一、SPUSKU1、商品SPU和SKU2、SPU和SKU的關系3、實現SPUSKU父子嵌套查詢1. **嵌套對象&#xff08;Nested Objects&#xff09;**2. **父子關系&#xff08;Parent-Child&#xff09;**3. **應用層關聯&#xff08;Application-Side Join&#xff09;**&#xff08;推薦…

Objective-c 初階 —— Runtime(方法交換 消息傳遞)

一、消息傳遞1、什么是消息[a func1];我們會把這種用方括號來調函數的方式稱為發消息。對于這個例子&#xff0c;就相當于我們給 a 這個對象發了個 func1 的消息&#xff08;個人認為指令更好理解&#xff09;。2、什么是 selectorselector 就是一個函數區分器。它只會給這個方…

【計算機網絡架構】樹型架構簡介

引言在當今數字化時代&#xff0c;網絡架構如同復雜的神經系統&#xff0c;支撐著各種信息的流通與交互。從個人日常的網絡瀏覽、在線購物&#xff0c;到企業的遠程辦公、數據存儲&#xff0c;再到國家層面的政務信息化、智慧城市建設&#xff0c;網絡架構都扮演著不可或缺的角…

llama-factory快速開始

llama-factory快速開始 文章目錄llama-factory快速開始前言一、環境配置1.1 訓練順利運行需要包含4個必備條件1.2 llama-factory下載1.3 環境下載1.4 硬件環境校驗二、啟動前言 https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md這是GitHub中文介紹文檔&#…

408數據結構強化(自用)

常用代碼片段&#xff08;持續更新&#xff09;折半查找void SearchBinary(int A[];int x){int low 0, high n-1, mid;while(low<high){mid (lowhigh)/2;if(A[mid]x) break;else if(A[mid] < x) low mid 1;else high mid - 1;}順序表逆置void Reverse(SqList &…

linux cpu頻率和AVS調壓等級

1&#xff0c;linux常見的cpu頻率對應的電壓等級對應參數表如下:頻率&#xff08;GHz&#xff09;電壓&#xff08;V&#xff09;1.61.41.41.21.21.01.00.82&#xff0c;avs調壓的幾種方式linux內核宏解釋Linux內核中&#xff0c;AVS調壓的實現依賴于一些宏定義和配置選項&…

Input輸入和Screen相關

知識點using System.Collections; using System.Collections.Generic; using UnityEngine;public class Lesson11 : MonoBehaviour {// Start is called before the first frame updatevoid Start(){}// Update is called once per framevoid Update(){#region 注意&#xff0c…

如何在CSDN變現?如何賺錢?如何漲粉?如何找到優質大V博主合作伙伴?

&#x1f525; 2025最新 如何在CSDN變現&#xff1f;如何賺錢&#xff1f;如何跟對人&#xff1f;如何找到優質博主合作伙伴&#xff1f; 大家好&#xff0c;我是貓頭虎&#xff0c;今天??想和大家聊聊在CSDN平臺變現的問題。這也是絕大多數伙伴非常關心的一個話題——其實&…

OpenCV特征點提取算法orb、surf、sift對比

下面是 OpenCV 中三種常用特征點提取算法&#xff1a;ORB、SURF 和 SIFT 的詳細對比&#xff0c;從 算法原理、性能、使用限制 和 適用場景 多維度進行總結&#xff0c;幫助大家在實際項目中合理選擇。一覽表&#xff1a;ORB vs. SURF vs. SIFT屬性/算法ORBSURFSIFT全稱Oriente…

LeafletJS 與 React:構建現代地圖應用

引言 LeafletJS 是一個輕量、靈活的 JavaScript 地圖庫&#xff0c;廣泛用于創建交互式 Web 地圖&#xff0c;而 React 作為現代前端框架&#xff0c;以其組件化、狀態管理和虛擬 DOM 特性&#xff0c;成為構建動態用戶界面的首選工具。將 LeafletJS 與 React 結合&#xff0c…