【機器學習基礎】機器學習入門核心算法:GBDT(Gradient Boosting Decision Tree)

在這里插入圖片描述

機器學習入門核心算法:GBDT(Gradient Boosting Decision Tree)

      • 1. 算法邏輯
      • 2. 算法原理與數學推導
        • 2.1 目標函數
        • 2.2 負梯度計算
        • 2.3 決策樹擬合
        • 2.4 葉子權重計算
        • 2.5 模型更新
      • 3. 模型評估
        • 評估指標
        • 防止過擬合
      • 4. 應用案例
        • 4.1 金融風控
        • 4.2 推薦系統
        • 4.3 計算機視覺
      • 5. 面試題及答案
      • 6. 優缺點分析
        • 優點
        • 缺點
      • 7. 數學推導示例(回歸問題)

1. 算法邏輯

GBDT 是一種基于決策樹的集成學習算法,屬于 Boosting 家族。其核心思想是串行訓練多個弱學習器(決策樹),每棵樹學習前序模型殘差的負梯度,最終通過加權求和得到強學習器。核心邏輯如下:

  • 初始化:用常數值初始化模型(如目標均值)
    F 0 ( x ) = arg ? min ? γ ∑ i = 1 n L ( y i , γ ) F_0(x) = \arg\min_\gamma \sum_{i=1}^n L(y_i, \gamma) F0?(x)=argγmin?i=1n?L(yi?,γ)
  • 迭代訓練
    • 計算當前模型的偽殘差(負梯度)
    • 訓練新樹擬合該殘差
    • 更新模型: F m ( x ) = F m ? 1 ( x ) + ν h m ( x ) F_m(x) = F_{m-1}(x) + \nu h_m(x) Fm?(x)=Fm?1?(x)+νhm?(x) ν \nu ν為學習率)
  • 最終輸出:加權樹組合
    F ( x ) = ∑ m = 0 M ν h m ( x ) F(x) = \sum_{m=0}^M \nu h_m(x) F(x)=m=0M?νhm?(x)

2. 算法原理與數學推導

2.1 目標函數

設訓練集 { ( x i , y i ) } i = 1 n \{(x_i,y_i)\}_{i=1}^n {(xi?,yi?)}i=1n?,損失函數 L ( y , F ( x ) ) L(y, F(x)) L(y,F(x)),目標是最小化正則化目標函數:
L = ∑ i = 1 n L ( y i , F ( x i ) ) + ∑ m = 1 M Ω ( h m ) \mathcal{L} = \sum_{i=1}^n L(y_i, F(x_i)) + \sum_{m=1}^M \Omega(h_m) L=i=1n?L(yi?,F(xi?))+m=1M?Ω(hm?)
其中 Ω ( h m ) = γ T + 1 2 λ ∥ w ∥ 2 \Omega(h_m) = \gamma T + \frac{1}{2}\lambda \|w\|^2 Ω(hm?)=γT+21?λw2 T T T為葉子數, w w w為葉子權重)

2.2 負梯度計算

在第 m m m 次迭代,計算偽殘差:
r i m = ? [ ? L ( y i , F ( x i ) ) ? F ( x i ) ] F ( x ) = F m ? 1 ( x ) r_{im} = -\left[ \frac{\partial L(y_i, F(x_i))}{\partial F(x_i)} \right]_{F(x)=F_{m-1}(x)} rim?=?[?F(xi?)?L(yi?,F(xi?))?]F(x)=Fm?1?(x)?

損失函數偽殘差 r i m r_{im} rim?
平方損失 y i ? F m ? 1 ( x i ) y_i - F_{m-1}(x_i) yi??Fm?1?(xi?)
絕對損失 sign ( y i ? F m ? 1 ( x i ) ) \text{sign}(y_i - F_{m-1}(x_i)) sign(yi??Fm?1?(xi?))
Huber損失分段函數
對數損失(分類) y i ? 1 1 + e ? F m ? 1 ( x i ) y_i - \frac{1}{1+e^{-F_{m-1}(x_i)}} yi??1+e?Fm?1?(xi?)1?
2.3 決策樹擬合

訓練新樹 h m h_m hm? 擬合偽殘差 { ( x i , r i m ) } \{(x_i, r_{im})\} {(xi?,rim?)},通過遞歸分裂節點:

  • 分裂準則:最大化增益(Gain)
    Gain = 1 2 [ G L 2 H L + λ + G R 2 H R + λ ? ( G L + G R ) 2 H L + H R + λ ] ? γ \text{Gain} = \frac{1}{2} \left[ \frac{G_L^2}{H_L + \lambda} + \frac{G_R^2}{H_R + \lambda} - \frac{(G_L+G_R)^2}{H_L+H_R+\lambda} \right] - \gamma Gain=21?[HL?+λGL2??+HR?+λGR2???HL?+HR?+λ(GL?+GR?)2?]?γ
    其中 G = ∑ i ∈ I g i G = \sum_{i \in I} g_i G=iI?gi? H = ∑ i ∈ I h i H = \sum_{i \in I} h_i H=iI?hi? g i g_i gi?為一階導, h i h_i hi?為二階導)
2.4 葉子權重計算

對葉子節點 j j j,最優權重為:
w j ? = ? ∑ i ∈ I j g i ∑ i ∈ I j h i + λ w_j^* = -\frac{\sum_{i \in I_j} g_i}{\sum_{i \in I_j} h_i + \lambda} wj??=?iIj??hi?+λiIj??gi??

2.5 模型更新

F m ( x ) = F m ? 1 ( x ) + ν ∑ j = 1 J w j 1 ( x ∈ R j ) F_m(x) = F_{m-1}(x) + \nu \sum_{j=1}^J w_j \mathbf{1}(x \in R_j) Fm?(x)=Fm?1?(x)+νj=1J?wj?1(xRj?)

3. 模型評估

評估指標
任務類型常用指標
回歸MSE, MAE, R 2 R^2 R2
分類Accuracy, F1-Score, AUC-ROC
排序NDCG, MAP
防止過擬合
  • 早停法:驗證集性能不再提升時停止迭代
  • 正則化:通過 γ \gamma γ, λ \lambda λ 控制復雜度
  • 子采樣:每次迭代隨機選擇部分樣本或特征

4. 應用案例

4.1 金融風控
  • 場景:信用評分卡
  • 特征:收入、負債比、交易頻率
  • 效果:AUC 提升 12% 對比邏輯回歸
4.2 推薦系統
  • 場景:電商點擊率預測
  • 特征組合:自動學習“用戶年齡×商品類別”等交叉特征
  • 優勢:處理高維稀疏特征優于協同過濾
4.3 計算機視覺
  • 場景:圖像語義分割
  • 做法:GBDT 處理 CNN 提取的特征向量
  • 結果:在 Pascal VOC 上 mIOU 提升 3.2%

5. 面試題及答案

Q1:GBDT 為什么擬合負梯度?
A:通過梯度下降在函數空間優化,負梯度是損失下降最快的方向。

Q2:如何處理分類特征?
A:最佳實踐是使用直方圖算法(如 LightGBM):

  1. 按特征取值排序
  2. 根據梯度直方圖尋找最優分裂點
  3. 復雜度從 O ( # categories ) O(\#\text{categories}) O(#categories) 降至 O ( bin ) O(\text{bin}) O(bin)

Q3:GBDT vs Random Forest?

維度GBDTRandom Forest
基學習器關系串行依賴并行獨立
偏差-方差低偏差低方差
過擬合易過擬合(需早停)抗過擬合能力強
數據敏感度需特征縮放無需特征縮放

6. 優缺點分析

優點
  1. 非線性能力強:自動捕捉高階交互特征
  2. 魯棒性好:對異常值和缺失值不敏感
  3. 可解釋性:可通過特征重要性分析(累積分裂增益)
    Importance j = ∑ splits ( j ) Gain \text{Importance}_j = \sum_{\text{splits}(j)} \text{Gain} Importancej?=splits(j)?Gain
  4. 適用廣泛:支持回歸/分類/排序任務
缺點
  1. 訓練效率低:串行訓練無法并行化(改進:LightGBM 用 leaf-wise 生長)
  2. 高維稀疏數據:文本數據表現不如神經網絡
  3. 超參敏感:需精細調參(樹深度、學習率等)

7. 數學推導示例(回歸問題)

目標:最小化平方損失 L = 1 2 ( y i ? F ( x i ) ) 2 L = \frac{1}{2}(y_i - F(x_i))^2 L=21?(yi??F(xi?))2
偽殘差
r i = ? ? L ? F ∣ F = F m ? 1 = y i ? F m ? 1 ( x i ) r_i = -\frac{\partial L}{\partial F} \bigg|_{F=F_{m-1}} = y_i - F_{m-1}(x_i) ri?=??F?L? ?F=Fm?1??=yi??Fm?1?(xi?)
葉子權重(設 λ = 0 \lambda=0 λ=0):
w j ? = ∑ i ∈ R j r i ∣ R j ∣ = 殘差的均值 w_j^* = \frac{\sum_{i \in R_j} r_i}{|R_j|} = \text{殘差的均值} wj??=Rj?iRj??ri??=殘差的均值
模型更新
F m ( x ) = F m ? 1 ( x ) + ν ∑ j = 1 J w j 1 ( x ∈ R j ) F_m(x) = F_{m-1}(x) + \nu \sum_{j=1}^J w_j \mathbf{1}(x \in R_j) Fm?(x)=Fm?1?(x)+νj=1J?wj?1(xRj?)


💡 關鍵洞察:GBDT 將優化問題轉化為函數空間的梯度下降,每棵樹對應一次梯度更新。實際應用優先選擇改進算法(XGBoost/LightGBM/CatBoost),它們在效率、準確性和工程實現上均有顯著提升。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84867.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84867.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84867.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

水墨色調中國風PPT模版分享

水墨色調中國風PPT模版分享:水墨中國風PPT模版https://pan.quark.cn/s/4368c537b1d2 第一套PPT模版?:主題是“愛蓮說”,水墨風格封面。核心視覺是綠色蓮蓬、白鶴、紅色印章,文字有“愛蓮說”等。適用文學或傳統文化類演示。 ?第…

PBX、IP PBX、FXO 、FXS 、VOIP、SIP 的概念解析以及關系

PBX(Private Branch Exchange) 概念 :PBX 是專用交換機,是一種在企業或組織內部使用的電話交換系統。它允許內部用戶之間以及內部用戶與外部公共電話網絡(PSTN)之間進行通信。例如,在一個大型企…

LabVIEW雙光子熒光成像軟件開發

雙光子熒光成像技術在抑郁小鼠腦內丙二醛(MDA)和甲醛(FA)檢測中的軟件開發,基于 LabVIEW 平臺構建從硬件控制、數據采集到圖像處理的全流程系統。結合 5734 FPGA 實現實時圖像處理,突出雙光子成像的深度開發…

OSI模型中的網絡協議

一、電子郵件協議:從SMTP到MIME的擴展 電子郵件系統的核心協議包括SMTP(Simple Mail Transfer Protocol)、POP3(Post Office Protocol)和IMAP(Internet Message Access Protocol),但…

流程自動化引擎:讓業務自己奔跑

在當今競爭激烈的商業環境中,企業面臨著快速變化的市場需求、日益復雜的業務流程以及不斷增長的運營成本。如何優化業務流程、提升效率并降低成本,成為企業持續發展的關鍵問題。 流程自動化引擎(Process Automation Engine)作為一…

DNS解析過程以及使用的協議名稱

DNS(Domain Name System 域名系統)解析是一個分層查詢的過程 1.本地緩存查詢階段 先檢查瀏覽器自身的DNS緩存 接著檢查操作系統的DNS緩存 最后檢查本地 hosts 文件 2.本地DNS服務器查詢階段 先向本地DNS服務器查詢,協議是 DNS over UDP&a…

思澈科技助力Keep Watch Pilot 1:重新定義智能運動手表體驗

——以創新芯片技術,打造長續航、高性能的隨身運動教練 作為智能穿戴領域的核心技術支持者,思澈科技攜手Keep共同推出全新智能運動手表Keep Watch Pilot 1。該產品搭載思澈科技自主研發的SF32LB557芯片,在高性能顯示、超長續航與精準運動監測…

github actions入門指南

GitHub Actions 是 GitHub 提供的持續集成和持續交付(CI/CD)平臺,允許開發者自動化軟件工作流程(如構建、測試、部署)。以下是詳細介紹: 一、核心概念 Workflow(工作流程) 持續集成的…

Pytorch中一些重要的經典操作和簡單講解

Pytorch中一些重要的經典操作和簡單講解: 形狀變換操作 reshape() / view() import torchx torch.randn(2, 3, 4) print(f"原始形狀: {x.shape}")# reshape可以處理非連續張量 y x.reshape(6, 4) print(f"reshape后: {y.shape}")# view要求…

ubuntu下nginx

我用的是ubuntu22 配置文件的準確位置 靜態網頁的存放位置 放大看到在靜態文件部署的配置路徑 該路徑下面有一個default文件查看 針對上圖的解析如下: 找到root /var/www/html 我嘗試把自己的一個index文件設置為默認,復制到/var/www/html下 ctrl加…

Git使用手冊保姆級教程

Git 使用手冊 一、Git 簡介與安裝 什么是Git? ? Git 是一個分布式版本控制系統,用于跟蹤文件變化,支持多人協作開發。 安裝步驟 ? Windows:通過 Git官網 下載安裝包,按默認配置安裝即可。 ? macOS&#xff1a…

k8s Headless Service

Kubernetes 無頭服務(Headless Service)配置與使用場景 1.無頭服務概述 無頭服務(Headless Service)是 Kubernetes 中的一種特殊服務類型,它**不分配集群 IP(ClusterIP),而是直接暴露…

基本面高股息策略

策略概述 一種基于基本面高股息策略的投資策略,主要通過Python在聚寬平臺上實現。該策略的核心思想是通過篩選出具有優質基本面和高股息率的股票進行投資,以期獲得穩定的長期回報。策略包括以下幾個主要步驟: 1. 初始化與參數設置:定義策略的基本參數和回測設置。 2. 每日…

GaussDB資源凍結與解凍:精細化資源管理的實踐與策略

GaussDB資源凍結與解凍:精細化資源管理的實踐與策略 引言 在云計算環境中,數據庫資源的動態調配能力直接影響業務成本與穩定性。華為云GaussDB作為新一代分布式數據庫,通過??資源凍結(Resource Quota Freeze)??與…

設計模式24——訪問者模式

寫文章的初心主要是用來幫助自己快速的回憶這個模式該怎么用,主要是下面的UML圖可以起到大作用,在你學習過一遍以后可能會遺忘,忘記了不要緊,只要看一眼UML圖就能想起來了。同時也請大家多多指教。 訪問者模式(Visito…

cuda編程筆記(2)--傳遞參數、設備屬性

以下是最簡單的帶參數的核函數使用過程&#xff1a; #include<iostream> #include<cstdio> #include "cuda_runtime.h" #include "device_launch_parameters.h" __global__ void add(int a,int b,int *c) {*c a b; } int main() {int c;int…

C# WinForm應用程序多語言實現全面指南

目錄 引言 一、多語言實現基礎概念 1.1 多語言實現的核心原理 1.2 .NET本地化支持機制 二、基于XML的多語言實現方案 2.1 方案概述 2.2 XML文件結構示例 2.3 實現步驟 2.4 優缺點分析 三、基于.resx資源文件的多語言實現 3.1 方案概述 3.2 實現步驟 3.3 資源文件結…

Python爬蟲實戰:研究Playwright框架相關技術

1 引言 1.1 研究背景與意義 網絡爬蟲作為一種自動獲取互聯網信息的技術,在數據采集、信息監測、競爭情報等領域具有廣泛應用。隨著 Web 技術的發展,越來越多的網站采用 JavaScript 動態渲染技術,傳統爬蟲工具難以有效獲取完整的頁面內容。Playwright 作為新一代自動化測試…

中企出海大會|打造全球化云計算一張網,云網絡助力中企出海和AI創新

全球化是阿里云的長期戰略&#xff0c;未來阿里云將持續加大云和 AI 基礎設施建設投入。首先是加速打造全球化的云計算網絡&#xff0c;一張具備 AI技術服務能力和全球競爭力的云計算網絡是阿里云的長期目標。 —— 阿里巴巴集團 CEO、阿里云智能集團董事長兼 CEO 吳泳銘 5 月 …

唯創WT2606B TFT顯示靈動方案,重構電子鎖人機互動界面,賦能智能門鎖全場景交互!

在智能家居的浪潮中&#xff0c;門鎖搭載顯示屏已成為行業創新的焦點。據行業數據顯示&#xff0c;2023年全球智能門鎖出貨量中&#xff0c;搭載顯示屏的型號占比已突破40%&#xff0c;且年復合增長率達25%。而2024年國內智能門鎖銷量突破2200萬套&#xff0c;預計2025年市場規…