支持向量機核心知識總結

一、核心基礎概念

  1. 核心目標:在樣本空間中找到劃分超平面,將不同類別樣本分開,且該超平面對訓練樣本局部擾動的 “容忍性” 最優(即抗干擾能力強)。
  2. 超平面定義
    • 超平面是 n 維空間中的 n-1 維子空間,是 SVM 分類的核心依據:
      • 3 維空間中,超平面為 2 維平面;2 維空間中,超平面為 1 維直線。
      • 數學表達式:wTx+b=0,其中w是 n 維向量(超平面法向量),b是實數(超平面截距),x是樣本向量。
  3. 關鍵指標:Margin(間隔)與支持向量
    • Margin(間隔):兩類樣本中距離超平面最近的點到超平面距離的 2 倍(Margin=2d,d為最近點到超平面的距離),SVM 的核心優化目標是最大化 Margin,以提升模型泛化能力。
    • 支持向量:距離超平面最近的樣本點,是決定超平面位置的關鍵樣本,其他樣本對超平面無影響。
  4. 樣本標簽與決策方程
    • 樣本標簽:正例標注為y=+1,負例標注為y=?1,便于后續約束條件推導。
    • 決策方程:y(x)=w?Φ(x)+b,其中Φ(x)是樣本x的特征映射(用于解決低維不可分問題,后續詳細說明),若y(x)>0預測為正例,y(x)<0預測為負例。

二、核心優化邏輯

(一)優化目標推導

  1. 初始目標:最大化間隔Margin=2d,等價于最大化單個最近點到超平面的距離d。
  2. 點到超平面距離公式:n 維空間中,樣本x到超平面wTx+b=0的距離為d=wTw?∣wTx+b∣?。
  3. 約束條件簡化:通過對w和b進行放縮變換,使所有樣本滿足yi??(w?Φ(xi?)+b)≥1(保證所有樣本在超平面 “正確一側”,且支持向量滿足等號yi??(w?Φ(xi?)+b)=1)。
  4. 目標函數轉換:最大化d=wTw?1?(由距離公式及約束條件推導),等價于最小化21?wTw(將極大值問題轉化為更易求解的極小值問題,且平方項可簡化計算)。

(二)帶約束優化求解:拉格朗日乘子法

  1. 優化問題形式
    • 目標函數(極小化):minw,b?21?wTw
    • 約束條件(不等式):yi??(w?Φ(xi?)+b)≥1(i=1,2,...,n,n為樣本數)
  2. 拉格朗日函數構建:引入拉格朗日乘子αi?≥0,將帶約束優化轉化為無約束優化,函數形式為:L(w,b,α)=21?wTw?∑i=1n?αi?[yi??(w?Φ(xi?)+b)?1]
  3. 求解關鍵條件:對w和b求偏導并令其等于 0,得到核心等式:
    • w=∑i=1n?αi?yi?Φ(xi?)(w由支持向量的αi?、yi?和Φ(xi?)決定)
    • ∑i=1n?αi?yi?=0(αi?的約束條件)
  4. 對偶問題轉化:將w的表達式代入拉格朗日函數,原問題轉化為對偶問題 ——最大化∑i=1n?αi??21?∑i=1n?∑j=1n?αi?αj?yi?yj?Φ(xi?)TΦ(xj?),約束條件為∑i=1n?αi?yi?=0且αi?≥0。

三、關鍵拓展:解決實際問題

(一)軟間隔:應對噪聲與非完全可分數據

  1. 問題背景:現實數據常存在噪聲,硬間隔(要求所有樣本滿足yi??(w?Φ(xi?)+b)≥1)會導致超平面劃分效果差。
  2. 解決方案:引入松弛因子ξi?
    • 調整約束條件:yi??(w?Φ(xi?)+b)≥1?ξi?(ξi?≥0,ξi?越大,允許樣本偏離 “理想位置” 越多)。
    • 調整目標函數:minw,b,ξ?21?wTw+C∑i=1n?ξi?,其中C是懲罰參數:
      • C趨近于極大值:懲罰強,不允許樣本偏離,等價于硬間隔。
      • C趨近于極小值:懲罰弱,允許更多樣本偏離,避免過擬合。
  3. 軟間隔對偶求解:約束條件變為0≤αi?≤C(原硬間隔αi?≥0),其余求解邏輯與硬間隔一致。

(二)核變換:解決低維不可分問題

  1. 問題背景:部分數據在低維空間中無法用線性超平面分離(如環形分布數據)。
  2. 核心思路:通過特征映射Φ(x)將低維輸入空間的樣本映射到高維特征空間,使數據在高維空間中線性可分。
  3. 核函數:避免高維計算災難
    • 問題:高維空間中計算Φ(xi?)TΦ(xj?)(內積)復雜度極高(如 3 維映射到 9 維,復雜度為O(n2))。
    • 解決方案:引入核函數K(xi?,xj?)=Φ(xi?)TΦ(xj?),直接在低維空間計算,等價于高維空間內積,降低計算成本。
  4. 常見核函數
    • 線性核函數:適用于線性可分數據,K(xi?,xj?)=xiT?xj?。
    • 高斯核函數(RBF 核):適用于非線性可分數據,能將數據映射到無限維空間,K(xi?,xj?)=exp(?2σ2∥xi??xj?∥2?)(σ為帶寬參數,影響核函數平滑度)。

四、總結

支持向量機以 “最大化間隔” 為核心優化目標,通過硬間隔(線性可分)、軟間隔(應對噪聲)、核變換(應對非線性)三大策略,適配不同數據場景;求解過程依賴拉格朗日乘子法與對偶問題轉化,最終僅通過支持向量即可確定超平面,具備模型簡潔、泛化能力強的優勢,是分類任務中的經典且高效算法。

五、代碼

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/920705.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/920705.shtml
英文地址,請注明出處:http://en.pswp.cn/news/920705.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Spark學習記錄

1、Spark基礎介紹 1.1、Spark基礎概念 Spark是一種基于內存的快速、通用、可擴展的大數據分析計算引擎 1.2、Spark運行架構 運行過程&#xff1a; Driver 執行用戶程序&#xff08;Application&#xff09;的main()方法并創建 SparkContext&#xff0c;與 Cluster Manager 建…

二進制方式安裝部署 Logstash

背景說明 Logstash 是一個開源的數據收集和處理引擎&#xff0c;是 Elastic Stack 的重要組件之一。在本方案中&#xff0c;我們使用 Logstash 作為 Kubernetes 集群日志收集的關鍵組件&#xff0c;主要用于&#xff1a; 從 Kafka 消費各服務的日志數據對日志數據進行過濾和轉…

如何用 Kotlin 在 Android 手機開發一個計算器

使用 Kotlin 開發 Android 計算器1. 創建新項目 打開 Android Studio&#xff0c;選擇新建項目&#xff0c;模板選擇 "Empty Activity"&#xff0c;語言選擇 Kotlin&#xff0c;確保最低 API 級別為 21 或更高。2. 設計用戶界面 在 res/layout/activity_main.xml 中定…

【Hadoop】Zookeeper、HBase、Sqoop

Zookeeper概述Zookeeper可以監視HDFS系統的name node和data node&#xff0c;HBase也極度依賴zookeeper&#xff0c;因為zookeeper維護了HBase的源數據以及監控所有region server的健康狀態&#xff0c;如果region server宕機會通知master 。它也可以避免腦裂&#xff08;只有一…

MLIR - Linalg

簡介 Linalg是MLIR中的HHO&#xff08;High-level Hierarchical Optimization&#xff09;中的核心方言&#xff0c;設計用于支持如下的核心Transformation&#xff1a; Progressive Buffer Allocation.Parametric Tiling.Promotion to Temporary Buffer in Fast Memory.Tile…

SQL相關知識 CTF SQL注入做題方法總結

SQL MySQL基礎 MySQL基本操作 1.查詢本地所有數據庫&#xff1a; show databases; 2.使用數據庫&#xff1a;use 數據庫名; 3.查看當前使用的數據庫名&#xff1a;select database(); 4.查看當前使用的數據庫的所有表&#xff1a;show tables; 5.查看數據庫版本&#xff1a;sel…

魔方的使用

三階魔方入門玩法教程 【簡單實用11個公式】三階魔方分步還原公式圖解 【初級篇】三階魔方入門教程 1、底棱歸位&#xff08;底十字對中層&#xff09; 先頂黃白十字&#xff0c;旋轉對齊中層后&#xff0c;R’2翻到底層 2、底角歸位 上右-前-》右下 &#xff1a;URU’R’…

新手友好!剪映:開啟你的視頻剪輯之旅!(國際版)

一.軟件介紹 剪映&#xff08;CapCut&#xff09;是一款由??抖音旗下深圳市臉萌科技有限公司??開發的全功能視頻編輯軟件&#xff0c;自2019年5月上線以來&#xff0c;因其簡單易用且功能強大&#xff0c;受到了大量用戶的喜愛。 1.功能和作用&#xff1a; 功能類別主要…

使用AI大模型Seed1.5-VL精準識別開車接打電話等交通違法行為

原文鏈接 本案例根據用戶上傳的電子警察或道路卡口抓拍的圖片,使用豆包全新視覺深度思考模型Doubao-1.5-thinking-vision-pro,精準識別車牌號碼、車牌顏色、車身顏色、車輛品牌等車輛信息,同時通過算法精確識別開車打電話、未系安全帶等交通違法行為,具有極強的實用價值。…

騎行商城怎么開發

隨著騎行運動普及與數字化消費升級&#xff0c;“騎行中控數據變現積分商城”模式成為新趨勢。以下從核心步驟、關鍵要點、風險規避三方面&#xff0c;詳解如何搭建該類型小程序。一、明確核心架構與需求定位在開發前需確定小程序的核心邏輯與目標用戶&#xff0c;避免功能冗余…

揭秘表格推理的“思維革命”:RoT模型介紹

–– RoT: Enhancing Table Reasoning with Iterative Row-Wise Traversals今天&#xff0c;我想和大家探討一個我們每天都會遇到&#xff0c;卻可能從未深思過其背后奧秘的事物——表格。從公司的財務報表、醫療數據&#xff0c;到體育賽事統計&#xff0c;表格無處不在&#…

【C++】AVL樹(詳解)

文章目錄 上文鏈接一、什么是 AVL 樹二、AVL 樹的實現1. 引入平衡因子2. 整體結構3. AVL 樹中的插入操作(1) 插入節點(2) 更新平衡因子更新規則停止更新條件 4. 旋轉(1) 旋轉的目的(2) 右單旋(3) 左單旋(4) 左右雙旋(5) 右左雙旋 5. AVL 樹的查找與刪除6. AVL 樹的平衡檢測 三、…

shell編程-核心變量知識

文章目錄shell簡介如何學好shell初識shell什么是shell執行shell腳本常用的三種方式shell變量變量相關的配置文件變量的定義shell核心位置變量shell簡介 為什么學習shell&#xff0c;shell的作用 面試題&#xff1a;給你一臺主機你的操作流程是什么&#xff1f; 1.自動化安裝操…

微電網調度(風、光、儲能、電網交互)(MatlabPython代碼實現)

贈讀者&#xff1a;正在埋頭科研的你&#xff0c;或許有時你會困惑于 “投入” 與 “回報” 的時差&#xff0c;會疲憊于 “未知” 與 “確定” 的博弈&#xff0c;但請記得&#xff1a;那些看似 “無用” 的試錯&#xff0c;都是在為突破搭建階梯&#xff1b;那些獨自深耕的日…

CentOS 7 環境下安裝 JDK 1.8 及解決 wget 命令缺失問題

個人名片 &#x1f393;作者簡介&#xff1a;java領域優質創作者 &#x1f310;個人主頁&#xff1a;碼農阿豪 &#x1f4de;工作室&#xff1a;新空間代碼工作室&#xff08;提供各種軟件服務) &#x1f48c;個人郵箱&#xff1a;[2435024119qq.com] &#x1f4f1;個人微信&a…

psql介紹(PostgreSQL命令行工具)(pgAdmin內置、DBeaver、Azure Data Studio)數據庫命令行工具

文章目錄**1. psql 的核心功能**- **交互式操作**&#xff1a;通過命令行直接與 PostgreSQL 服務器交互&#xff0c;執行 SQL 查詢和管理命令。- **元命令支持**&#xff1a;提供以 \ 開頭的特殊命令&#xff08;如 \l、\d、\connect&#xff09;&#xff0c;用于管理數據庫對象…

設計模式9-責任鏈模式

定義 Chain of Responsibility Pattern&#xff1a;使多個對象都有機會處理請求&#xff0c;從而避免了請求的發送者和接受者之間的耦合關系。將這些對象連成一條鏈&#xff0c; 并沿著這條鏈傳遞該請求&#xff0c;直到有對象處理它為止。 優勢 解耦請求發送者與接收者&#…

使用JAVA制作minecraft紅石和創造模式插件

這一次主要是紅石和創造模式的新加入由于代碼較長&#xff0c;所以呃這一段代碼就直接勞煩各位呃插進之前的3.0版本里面!!!!!!!!!import org.lwjgl.*; import org.lwjgl.glfw.*; import org.lwjgl.opengl.*; import org.lwjgl.system.*;import java.nio.*; import java.util.*;…

Git 版本管理核心實踐與問題解決手冊

Git 的核心價值版本控制&#xff1a;完整記錄所有修改歷史&#xff0c;支持隨時回退到任意歷史版本團隊協作&#xff1a;允許多開發者同時工作&#xff0c;有效避免代碼沖突和覆蓋問題高效分支&#xff1a;通過分支隔離功能開發與穩定主線&#xff0c;保持項目穩定性變更追溯&a…

hadoop安欣醫院掛號看診管理系統(代碼+數據庫+LW)

摘 要 隨著信息技術的飛速發展&#xff0c;醫療服務行業正逐步向信息化、智能化轉型。安欣醫院掛號看診管理系統正是基于這一背景開發的一款集掛號、看診管理于一體的綜合性系統。本系統采用Hadoop大數據處理技術&#xff0c;旨在提高醫院掛號看診的效率&#xff0c;優化醫療…