【SVM】簡單介紹(一)

1、結構風險最小化

我們想要在未知的數據上得到低的錯誤率,這叫做structural risk minimization;相對的,訓練誤差叫做empirical risk minimization

要是我們能有這樣一個式子就好了:
Test?error?rate?<=train?error?rate?+f(N,h,p)\text { Test error rate }<=\text { train error rate }+f(N, h, p) ?Test?error?rate?<=?train?error?rate?+f(N,h,p)
其中,
N=\mathrm{N}=N= size of training set,
h=\mathrm{h}=h= measure of the model complexity,
p=p=p= the probability that this bound fails

我們需要一個ppp來限制最差的測試集的情況。然后我們就能通過選擇模型復雜度hhh來最小化測試誤差率的上界。

2、VC維(Vapnik-Chervonenkis dimension)

VC維就是衡量模型復雜度的一個重要概念

選擇nnn個樣本點,我們隨機的給它們分配標簽,如果我們的模型都能將它們分開,則樣本的VC維>=n>=n>=n,我們不斷地增大nnn,直到模型不能分開為止。模型能分開的最大的nnn值就是模型的VC維。
在這里插入圖片描述
考慮一條二維空間的一條直線的復雜度。如上圖所示,對于三個數據點,無論我們如何分配標簽,直線都能很好的將樣本正確分類。但是對于四個數據點,直線無法處理異或問題。因此,二維空間中一條直線的VC維是3.

二維空間中的超平面的VC維是3。更一般的,k維空間的超平面的VC維是k+1。

超平面的VC維與參數的數目相等。但這只是個巧合,事實上,模型的參數和模型的復雜度并沒有必然的聯系。例如,一個正弦曲線的VC維是正無窮大,但是它的參數只有3個。
f(x)=asin?(bx+c)f(x)=a \sin (b x+c) f(x)=asin(bx+c)
在這里插入圖片描述

最近鄰分類器的VC維是無窮大的,因為無論你有多少數據點,你都能在訓練集上得到完美的分類器。而當1-NN?→K-NN?\text { 1-NN } \rightarrow \text { K-NN }?1-NN??K-NN?,相當于減小了VC維。

一般來說,VC維越高,模型的分類能力更強,更flexible。但是VC維更多的是作為一個概念,實際上很難去計算一個模型的VC維。



回到剛才,經過前人推導,我們得到了一個測試集誤差的上界如下:
Etest?≤Etrain?+(h+hlog?(2N/h)?log?(p/4)N)12E_{\text {test }} \leq E_{\text {train }}+\left(\frac{h+h \log (2 N / h)-\log (p / 4)}{N}\right)^{\frac{1}{2}} Etest??Etrain??+(Nh+hlog(2N/h)?log(p/4)?)21?
N=\mathrm{N}=N= size of training set
h=VCh=V Ch=VC dimension of the model class
p=p=p= upper bound on probability that this bound fails

從上式看,Good?generalization?→large?Nand?small?h\text { Good generalization } \rightarrow \text { large } N \text { and small } h ?Good?generalization??large?N?and?small?h
這是符合我們的直覺的。上面這個式子的推導很復雜,但是在實際中也沒啥用,因為它給的上界太松了,一個很松的上界又有什么意義呢。

3、Hard-Margin SVM

在這里插入圖片描述
對于上面這個兩類分類問題,我們用直線進行分類,會發現有好多種分類方法。而SVM所選擇的那條直線,是將Margin 最大化的直線。
在這里插入圖片描述

為什么要最大化Margin?
  1. 直覺上感覺這最安全
  2. 實際工作中確實不錯
  3. 當數據有小波動時錯分的概率小一些
  4. 模型只與support vector有關
    在這里插入圖片描述
    點到直線的距離:
    d(x)=∣x?w+b∣∥w∥22=∣x?w+b∣∑i=1dwi2d(\mathbf{x})=\frac{|\mathbf{x} \cdot \mathbf{w}+b|}{\sqrt{\|\mathbf{w}\|_2^2}}=\frac{|\mathbf{x} \cdot \mathbf{w}+b|}{\sqrt{\sum_{i=1}^d w_i^2}} d(x)=w22??x?w+b?=i=1d?wi2??x?w+b?
    定義Margin:
    margin?≡arg?min?x∈Dd(x)=arg?min?x∈D∣x?w+b∣∑i=1dwi2\operatorname{margin} \equiv \underset{\mathbf{x} \in D}{\arg \min } \,d(\mathbf{x})=\underset{\mathbf{x} \in D}{\arg \min } \frac{|\mathbf{x} \cdot \mathbf{w}+b|}{\sqrt{\sum_{i=1}^d w_i^2}} marginxDargmin?d(x)=xDargmin?i=1d?wi2??x?w+b?
    所以我們就要考慮如何來最大化這個Margin了。

那么我們的問題就可以建模為:
argmax?w,bmargin?(w,b,D)=arg?max?w,barg?min?xi∈Dd(xi)=arg?max?w,barg?min?xi∈D∣b+xi?w∣∑i=1dwi2\begin{aligned} & \underset{\mathbf{w}, b}{\operatorname{argmax}} \operatorname{margin} (\mathbf{w}, b, D) \\ & =\underset{\mathbf{w}, b}{\arg\max}\, \underset{\mathbf{x}_i \in D}{\arg \min } \,d\left(\mathbf{x}_i\right) \\ & =\underset{\mathbf{w}, b}{\arg\max} \,\underset{\mathbf{x}_i \in D}{\arg \min } \frac{\left|b+\mathbf{x}_i \cdot \mathbf{w}\right|}{\sqrt{\sum_{i=1}^d w_i^2}} \end{aligned} ?w,bargmax?margin(w,b,D)=w,bargmax?xi?Dargmin?d(xi?)=w,bargmax?xi?Dargmin?i=1d?wi2??b+xi??w??
如果只是這樣的話,肯定是不行的,想像一下,一條直線離兩類都非常遠,也是符合上式的,因此需要附加條件,也就是直線能正確分類。
WXi+b≥0iff?yi=1WXi+b≤0iff?yi=?1yi(WXi+b)≥0\begin{gathered} \mathbf{W X _ { i }}+b \geq 0 \text { iff } y_i=1 \\ \mathbf{W X _ { i }}+b \leq 0 \text { iff } y_i=-1 \\ y_i\left(\mathbf{W X _ { i }}+b\right) \geq 0 \end{gathered} WXi?+b0?iff?yi?=1WXi?+b0?iff?yi?=?1yi?(WXi?+b)0?
也就是
argmax?w,barg?min?xi∈D∣b+xi?w∣∑i=1dwi2subject?to??xi∈D:yi(xi?w+b)≥0\begin{aligned} & \underset{\mathbf{w}, b}{\operatorname{argmax}} \,\underset{\mathbf{x}_i \in D}{\arg \min } \frac{\left|b+\mathbf{x}_i \cdot \mathbf{w}\right|}{\sqrt{\sum_{i=1}^d w_i^2}} \\ & \text { subject to } \forall \mathbf{x}_i \in D: y_i\left(\mathbf{x}_i \cdot \mathbf{w}+b\right) \geq 0 \end{aligned} ?w,bargmax?xi?Dargmin?i=1d?wi2??b+xi??w??subject?to??xi?D:yi?(xi??w+b)0?
這邊對一個限制條件進行強化,假設
?xi∈D:∣b+xi?w∣≥1\forall \mathbf{x}_i \in D:\left|b+\mathbf{x}_i \cdot \mathbf{w}\right| \geq 1 ?xi?D:b+xi??w1
因為咱們是對w進行優化,所以本質上其實是一樣的,就是一個縮放的問題。

那么對里層的優化,有:
arg?min?xi∈D∣b+xi?w∣∑i=1dwi2≥arg?min?xi∈D1∑i=1dwi2=1∑i=1dwi2\underset{\mathbf{x}_i \in D}{\arg \min } \frac{\left|b+\mathbf{x}_i \cdot \mathbf{w}\right|}{\sqrt{\sum_{i=1}^d w_i^2}} \geq \underset{\mathbf{x}_i \in D}{\arg \min } \frac{1}{\sqrt{\sum_{i=1}^d w_i^2}}=\frac{1}{\sqrt{\sum_{i=1}^d w_i^2}} xi?Dargmin?i=1d?wi2??b+xi??w?xi?Dargmin?i=1d?wi2??1?=i=1d?wi2??1?

對于外層優化,只需最大化里層的下界就行,于是問題化為:
argmin?w,b∑i=1dwi2subject?to??xi∈D:yi(xi?w+b)≥1\begin{aligned} & \underset{\mathbf{w}, b}{\operatorname{argmin}} \sum_{i=1}^d w_i^2 \\ & \text { subject to } \forall \mathbf{x}_i \in D: y_i\left(\mathbf{x}_i \cdot \mathbf{w}+b\right) \geq 1 \end{aligned} ?w,bargmin?i=1d?wi2??subject?to??xi?D:yi?(xi??w+b)1?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/258302.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/258302.shtml
英文地址,請注明出處:http://en.pswp.cn/news/258302.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

L8_2

4.留下pid為12345的那個sh進程&#xff0c;殺死系統中所有其它sh進程 ps –ef|grep sh |awk ‘{if($2!”12345”) {print “kill “$2}}’ >killpid.sh cat killpid.sh ./killpid.sh 5. 根據以下日志文件&#xff0c;計算使用各種瀏覽器的人所占的百分比&#xff08;注意先排…

iOS 打包iPa

http://blog.fir.im/how-to-build-adhoc-ipa/ 之前都是打包好ipa然后發送給客戶&#xff0c;特麻煩&#xff0c;fir.im網站不錯 迅速獲取自己手機的udid: http://fir.im/udid 網頁安裝ipa&#xff1a; http://fir.im/cxsv 轉載于:https://www.cnblogs.com/shidaying/p/4829102…

# 遍歷刪除字典元素_第六章 字典

一、使用字典一個簡單的字典字典是一系列鍵——值對。每個鍵都與一個值相關聯&#xff0c;可以使用鍵來訪問與之相關聯的值。與鍵相關聯的值可以是數字、字符串、列表乃至字典。事實上&#xff0c;可將任何Python對象用作字典中的值。在Python中&#xff0c;字典用放在花括號{}…

user-select屬性用法

這是在css3 UI規范中新增的一個功能&#xff0c;用來控制內容的可選擇性。 auto——默認值&#xff0c;用戶可以選中元素中的內容none——用戶不能選擇元素中的任何內容text——用戶可以選擇元素中的文本element——文本可選&#xff0c;但僅限元素的邊界內(只有IE和FF支持)all…

弄清 CSS3 的 transition 和 animation

弄清 CSS3 的 transition 和 animation 原文:弄清 CSS3 的 transition 和 animation弄清 CSS3 的 transition 和 animation transition transition 屬性是transition-property,transition-duration,transition-timing-function,transition-delay的簡稱,用于設定一個元素的兩個狀…

【SVM】簡單介紹(二)

1、SVM另一種推法 我們不管分類平面&#xff0c;直接去假設Margin的兩個邊界&#xff1a; Plus-plane {x:w?xb1}Minus-plane {x:w?xb?1}\begin{aligned} & \text { Plus-plane }\{\boldsymbol{x}: \boldsymbol{w} \cdot \boldsymbol{x}b1\} \\ & \text { Minus-plan…

圖像像素點賦值_Python 圖像處理 OpenCV (2):像素處理與 Numpy 操作以及 Matplotlib 顯示圖像...

普通操作1. 讀取像素讀取像素可以通過行坐標和列坐標來進行訪問&#xff0c;灰度圖像直接返回灰度值&#xff0c;彩色圖像則返回B、G、R三個分量。需要注意的是&#xff0c; OpenCV 讀取圖像是 BGR 存儲顯示。灰度圖片讀取操作&#xff1a;import cv2 as cv# 灰度圖像讀取gray_…

cocopods

一、什么是CocoaPods 1、為什么需要CocoaPods 在進行iOS開發的時候&#xff0c;總免不了使用第三方的開源庫&#xff0c;比如SBJson、AFNetworking、Reachability等等。使用這些庫的時候通常需要&#xff1a; 下載開源庫的源代碼并引入工程向工程中添加開源庫使用到的framework…

CSS3學習手記(10) 過渡

CSS3過渡 允許css的屬性值在一定的時間內平滑地過渡在鼠標單擊、獲取焦點、被點擊或對元素任何改變中觸發&#xff0c;并圓滑地以動畫效果改變CSS的屬性值transition transition-property屬性檢索或設置對象中的參與過渡的屬性 語法 transition-property:none|all|property …

POJ 1286 Necklaces of Beads (Burnside定理,有限制型)

題目鏈接&#xff1a;http://vjudge.net/problem/viewProblem.action?id11117 就是利用每種等價情形算出置換節之后算組合數 #include <stdio.h> #include <cstring> #include <cstdlib> #include <algorithm> #include <cmath>using namespace…

全局搜索快捷鍵_Windows 自帶的聚合搜索來了,與 Mac 的 Spotlight 相比體驗如何?...

最近 Windows 10 推出了自帶的聚合搜索功能 PowerToys Run&#xff0c;取代了之前的 WinR。蘋果的 macOS 以人性化著稱&#xff0c;有幾個功能讓 Windows 用戶一直很羨慕&#xff0c;比如全局的聚合搜索工具 Spotlight。在任何界面 command空格&#xff0c;輸入關鍵字就能搜索電…

transform你不知道的那些事

transform是諸多css3新特性中最打動我的&#xff0c;因為它讓方方正正的box module變得真實了。 transform通過一組函數實現了對盒子大小、位置、角度的2D或者3D變換。不過很長時間內&#xff0c;我對以下問題都想不太明白&#xff1a; 1、尺寸縮放scale與zoom變換有何不同&…

【SVM】簡單介紹(三)

我們考慮SVM的對偶問題&#xff0c;我們通常是在對偶空間中進行求解的。 1、Lagrange Multipliers 對于一個很一般的問題 Minimize f(x)subject to {a(x)≥0b(x)≤0c(x)0\begin{aligned} \text { Minimize } & f(x) \\ \text { subject to } \quad & \left\{\begin{a…

玩轉iOS開發:NSURLSession講解(三)

文章分享至我的個人技術博客: https://cainluo.github.io/14986211698053.html 前言 雖然前面兩講都是說了NSURLSession的一些理論上的知識, 但我們現在起碼對NSURLSession有個大概的了解, 并不會像一開始的那樣, 一臉懵逼的看著, 這個請求是什么鬼, 那個方法是什么鬼, Task是什…

輕松搞定面試中的二叉樹題目

版權全部&#xff0c;轉載請注明出處&#xff0c;謝謝&#xff01;http://blog.csdn.net/walkinginthewind/article/details/7518888 樹是一種比較重要的數據結構&#xff0c;尤其是二叉樹。二叉樹是一種特殊的樹&#xff0c;在二叉樹中每一個節點最多有兩個子節點&#xff0c;…

李倩星r語言實戰_《基于R的統計分析與數據挖掘》教學大綱

《基于R的統計分析與數據挖掘》課程教學大綱課程代碼&#xff1a;090542009課程英文名稱&#xff1a;R Language and Data Mining課程總學時&#xff1a;32講課&#xff1a;32實驗&#xff1a;0上機&#xff1a;0適用專業&#xff1a;應用統計學大綱編寫(修訂)時間&#xff1a;…

自動化測試小結

最近差不多一年從事自動化的測試工作&#xff0c;從開始對自動化一點都不了解到現在能從實現用例、手動命令行執行用例、自制工具來執行用例&#xff0c;感覺進步還是有的。 自動化測試對于手動測試應該是有不小的優勢的&#xff0c;雖然在自動化的用例實現中剛開始的時候會顯得…

python地理可視化_【Python教程】地理可視化之二

Basemap是Matplotlib的一個子包&#xff0c;負責地圖繪制。昨天的推送對如何繪制風向圖進行了描述&#xff0c;本文再次利用該包簡單介紹如何繪制海洋及海冰溫度彩色圖示&#xff0c;該圖常見于NOAA官網。具體操作如下&#xff1a;導入命令1)設置工作環境并導入程序包%cd "…

尋找白板上的便簽條

問題來源&#xff1a;http://answers.opencv.org/question/162480/contour-detection-for-gray-stickers-on-white-background/ 題目的大概意思就是這樣的白板&#xff0c;尋找上面的各種便簽條。我找到了橘色的&#xff0c;結果是這樣代碼是這樣Mat src imread("gray-st…

LeetCode Permutations

原題鏈接在這里&#xff1a;https://leetcode.com/problems/permutations/ 題目&#xff1a; Given a collection of distinct numbers, return all possible permutations. For example,[1,2,3] have the following permutations:[1,2,3], [1,3,2], [2,1,3], [2,3,1], [3,1,2]…