機器學習——支持向量機SVM之線性模型

目錄

一、沒有免費的午餐定理

二、支持向量機SVM(support vector machine)

1、線性模型和非線性模型

2、如何在線性模型中畫出一條直線(優化過程——vplink)

1)多少條?

2)如何畫出最好的直線?

3、如何去描述這個優化的過程(數學描述)

1)幾個重要的名詞(間隔、支持向量)

2)一些定義(訓練數據、標簽、超平面等)

>>>問題1:怎么求解w,b?

3)機器學習的任務與步驟(求解w,b)

三、支持向量機的優化問題(求最優劃分直線,性能指標為d)

1、優化問題(怎么將問題轉化為最優化問題?)

2、轉化為最優化問題的過程?

1)由支持向量X0和模型得到距離d的公式

?2)如何取得d最大?——(轉化問題的最優化量的思想)

>>>問題2:需不需要計算a?

>>>問題3:支持向量是怎么得到的?如何保證它滿足下面的式子?

3)轉化后的最優化問題數學描述(dmax——||w||min)

>>>問題4:以上的限制條件中哪些是已知哪些是未知?

>>>問題5:縮放后的w,b怎么求解?

>>>問題6:限制條件為什么大于等于1?

四、總結

1、機器學習與最優化聯系與區別

1)區別

2)聯系


?


?


?


課程鏈接:《浙江大學-研究生機器學習課程》

一、沒有免費的午餐定理

沒有免費的午餐定理:如果我們不對特征空間有先驗假設,則所有算法的平均表現是一樣的。

特征差距小的樣本更有可能是一類

二、支持向量機SVM(support vector machine)

vplink發明的支持向量機

SVM是最大化間隔的分類算法,是一種進行二元分類的廣義線性分類器;SVM也可以通過核方法來對非線性模型進行分類。

1、線性模型和非線性模型

通過一條直線可以將樣本分開為兩個特征的部分叫線性模型,反之叫非線性模型

2、如何在線性模型中畫出一條直線(優化過程——vplink)

1)多少條?

該直線將圓圈和叉區分開,按道理來說有無數條,所以需要找出一條最好的直線

2)如何畫出最好的直線?

先定義一個性能指標,比較每一條直線的性能指標,取性能指標最好的那條線作為最好的直線

這里是以d:間隔(margin)作為性能指標進行分析

①最優的情形

這里的性能指標是距離——將待定的直線向左和向右移動,直到該直線分別與各特征區域的一個或者多個特征值相交時停止移動,測量這時候兩條直線的距離,取該距離最大的直線為最優直線備選。

但是最優的直線也有無數條,因為與其平行的直線有無數條,該怎么取舍呢?

這時候將直線在d/2處的直線作為最終的直線,作為最優直線

②不是最優的情形

標題

3、如何去描述這個優化的過程(數學描述)

如何去描述這個優化的過程(數學描述)?

1)幾個重要的名詞(間隔、支持向量)

間隔d:margin——最優直線與兩邊最近特征值的距離和叫做間隔

支持向量X0:support vector——被平行線插到的向量叫做支持向量

2)一些定義(訓練數據、標簽、超平面等)

?

訓練數據(XN=【XN1,XN2,XN3,,,XNN】T是一個向量)及標簽(yi是1或-1):

?

線性模型:(W,b)——待定參數

W的轉置.dot(xi) + b = 0——超平面(Hyperplane)的方程,關于xi的一次線性方程

?

>>>問題1:怎么求解w,b?

答:超平面方程中X=xi,其中i = 1~N,而xi = (xi1,xi2,...,xin)T,因此根據方程可以得到N個方程,N取決于訓練的樣本數,n取決于樣本數的維數,通過求解N個關于w的一次方程組,即可以求解得到w,b,求解方程組的方法有高斯法等,具體可參考《數值分析》

線性模型最優化的任務——在二維的的時候找直線,在三維的時候找平面,在多維的時候找超平面,這里以二維為例

?

?

線性可分:

即:

?

3)機器學習的任務與步驟(求解w,b)

任務(已知(xN,yN),未知(W,b)):

通過這些訓練數據和標簽((xN,yN)),其中XN = (XN1,XN2,...,XNn)是一個向量,N表示訓練的樣本個數,n表示每一個樣本數的維度;在限定的模型(超平面方程)下,求解出待定系數(W,b),最后確定模型,機器學習的過程也就結束了

?

步驟:

a,通過一個方程來限定模型,如用一個超平面來限定多維模型;

b.在限定的模型中確定待定系數

c.通過訓練數據和限定的模型(方程)求解出待定系數,最后確定模型

三、支持向量機的優化問題(求最優劃分直線,性能指標為d)

1、優化問題(怎么將問題轉化為最優化問題?)

2、轉化為最優化問題的過程?

公式1:

1)由支持向量X0和模型得到距離d的公式

?2)如何取得d最大?——(轉化問題的最優化量的思想)

通過縮放求得d的公式(已知w,b,未知a,也就是后來的aw,ab,支持向量X0未知)

使得d最大的問題轉化為求||w||的最小值問題

?

>>>問題2:需不需要計算a?

答:不需要!因為這里主要是引入a來講解一下縮放的思想,即告訴我們通過a的縮放能夠將求解d最大值問題轉化為||w||最小值的問題,至于a縮放多少,因為不管a縮放多少,都要假設滿足以下式子(至于為什么這么假設,我也不知道,反正肯定是為了方便計算):

最后d的公式為:

d的公式分子為常數,因此問題dmax依據轉化為求||w||min

?

>>>問題3:支持向量是怎么得到的?如何保證它滿足下面的式子?

答:這里只是一個假設,實際上支持向量還未知,為我們最優化時的工作,這里只是相當于下了一個定義,限定了a的值來滿足這個假設,最優化的問題就是對縮放后的w進行求解,所以a沒必要進行求解,這里也求不出來

?

3)轉化后的最優化問題數學描述(dmax——||w||min)

凸函數的定義:《最優化課堂筆記04:非線性規劃——凸規劃》

凸函數及二次規劃問題的求解方法:《最優化課程筆記07——約束問題的非線性規劃方法(拉格朗日乘子法和懲罰函數法)》

>>>問題4:以上的限制條件中哪些是已知哪些是未知?

答:已知:xi,yi——即樣本數據,未知——w,b

注意這里要區分開前面通過訓練數據求得的w,b,前面的w,b是一個超平面方程,對所有的訓練數據都滿足,而這里的w,b是在超平面的基礎上進行縮放得到的,雖然平面是一樣的(由事實1得到):

但是w,b值已經發生了改變,并且這里要求解的w,b是在限制條件下進行求解的,雖然目標函數中看起來只有w,沒有b,但b在限制條件中,如果b的取值不能破壞了約束條件,也是不可以的。

?

>>>問題5:縮放后的w,b怎么求解?

答:先轉化為對偶問題,再使用拉格朗日函數進行求解

?

?

>>>問題6:限制條件為什么大于等于1?

答:首先根據線性可分性得到限制條件必然大于等于0,又因為問題dmax轉化為||w||min的問題時在支持向量上滿足,

所以在非支持向量上有:yi=1時,平面方程的模會大于1;即:

yi=-1時,平面方程的模會小于-1,即:

所以二者相乘就會大于等于1,當然也可以大于等于任何的正整數N,此時a的縮放就應該滿足:

結果一致,一般是大于等于1

四、總結

1、機器學習與最優化聯系與區別

1)區別

機器學習:通過已知的訓練數據在限定的模型下求解出模型的待定系數,得到這個問題的一個確切具體的模型,重點在于求解模型的待定系數w,b,求得的w,b只是滿足了將二元分類了,但不一定是最優的分類平面

最優化:求解出問題的最優解,即找到最優的分類平面

2)聯系

機器學習包含了最優化,其實機器學習就是在不斷地對數據進行優化,得到最優解。起初機器學習是通過現有的訓練數據得到一個模型,后面再通過學習(優化)求得最優解。

?

?

非線性模型的最優化問題該怎么求解呢?請看:《機器學習理論——支持向量機SVM之非線性模型》

?

還可以參考:《[機器學習筆記] 支持向量機SVM如何求解最佳模型?》

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/256445.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/256445.shtml
英文地址,請注明出處:http://en.pswp.cn/news/256445.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Oauth2.0和1.0區別

1.0的授權分3步, A)客戶端到授權服務器請求一個授權令牌(request token&secret) B)引導用戶到授權服務器請求授權 C)用訪問令牌到授權服務器換取訪問令牌(access token&secret) D)用訪問令牌去訪問得到授權的資源 2.0的用戶授權過程有2步, A)引導用戶到授權…

選導師,定方向

選導師,定方向。 看文獻看到9.40,實在是看不下去,索性寫一些自己這近兩年來的研究生生涯的一些感悟,希望對還在迷茫中的你們有一點點的啟示(如果談不上啟示,那就當給你們一點安慰)。 ** 選導師…

在apache中設置訪問目錄后進入的默認頁面為index.php

找到apache的配置文件httpd.conf后找到 DirectoryIndex index.html index.php 在其中添加index.php, 轉載于:https://www.cnblogs.com/itdi/p/5844517.html

spring@PropertySource用法

v測試例子 package com.hjzgg.auth.config;import org.springframework.beans.factory.annotation.Autowired; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.context.annot…

機器學習——支持向量機SVM之非線性模型(低維到高維映射)

目錄 一、非線性模型的最優化問題 1、非線性模型最優化模型 2、兩個概念 1)正則項(regularization term) 2)調參參數 2、高維映射 1)定義及作用 2)高維映射后的最優化模型 3)異或問題&…

html表單中get與post之間的區別

當用戶在 HTML 表單 (HTML Form) 中輸入信息并提交之后,有兩種方法將信息從瀏覽器傳送到 Web 服務器 (Web Server)。 一種方法是通過 URL,另外一種是在 HTTP Request 的 body 中。 前一種方法,我們使用 HTML Form 中的 method "get&quo…

世界坐標系,攝像機坐標系、圖像坐標系關系匯總

**攝像機標定:**在計算機視覺研究領域,攝像機標定是一個重要的環節。攝像機標定就是求取攝像機內外參數的過程。 世界坐標系:絕對坐標系,一般的三維場景都由這個坐標系來表示。攝像機可以放置在環境中的任何位置,因此可…

SpringMVC-HelloWorld

2.5、Hello World入門 2.5.1、準備開發環境和運行環境: ☆開發工具:eclipse ☆運行環境:tomcat6.0.20 ☆工程:動態web工程(springmvc-chapter2) ☆spring框架下載: spring-framework…

CSVN備份初體驗

備份方法挺多的,目前我知道有四種 其一: 首先復制舊csvn服務器上repositories下的版本庫文件夾到新csvn服務器repositories文件夾下面(做以下修改時最好把csvn服務停掉) 然后復制舊csvn的svn_auth_file到新csvn上(相當…

機器學習——支持向量機SVM之非線性模型(原問題和對偶問題)

目錄 一、原問題(prime problem) 二、原問題的對偶問題(dual problem) 1、定義一個輔助函數 2、定義對偶問題 >>>問題1:上面說到遍歷w,那w的取值范圍和取值步長是怎樣的?即遍歷的…

(轉)Apache?Rewrite?詳解

(轉)Apache Rewrite 詳解參考文檔:http://man.chinaunix.net/newsoft/ApacheManual/mod/mod_rewrite.htmlApache Rewrite 詳解一 入門RewriteEngine onRewriteRule !\.(js|ico|gif|jpg|png|css)$ index.php就這兩行. 然后就完成了URL重寫功能了. 首先服務器是需要支…

python輪廓函數的使用

在圖像的處理中有時候需要對圖像中的目標區域提出出輪廓 讀取圖像 調用OpenCV的庫使用cv.imread()來讀取圖像。 圖像為 灰度化 二值化 提取輪廓時,圖像一般都是二值化后的圖像。在本次程序中選用cv2.THRESH_BINARY的二值化方式。即將大于閾值的部分設定為255&am…

Intent Bundle頁面跳轉信息的傳遞

MainActivity LoginActivity LoginLayout 轉載于:https://www.cnblogs.com/xiaolei121/p/5846644.html

超易懂數據庫范式

那些數據庫的書介紹的數據庫范式,實在是晦澀難懂,我在這里給出一個通俗的描述:1NF:一個table中的列是不可再分的(即列的原子性)2NF:一個table中的行是可以唯一標示的,(即…

機器學習——支持向量機SVM之非線性模型(原問題轉化為對偶問題)

目錄 一、復習(原問題、對偶問題、KKT條件、凸函數) 二、將最優化問題標準化為原問題(嚴格轉化為標準形式) 1、原最優化問題 2、標準化后的問題 三、轉化為對偶問題(注意變量的對應關系) 四、對對偶問…

靜止的單攝像機無法得到像點的三維坐標詳解

我們知道在機器視覺中通常要使用的搭建的視覺測量系統對一個物體的尺寸、形變、以及三維形貌進行測量。一般按照攝像機的個數以及組成部分分為三類測量方法。分別為單目測量、雙目(大于2為多目)測量、以及結構光測量。 單目測量系統 顧名思義單目就指的…

一個比較笨的全文搜索的例子(分析結構用)-模糊查找

1 2 3 4 --在所有的char類型的列中模糊查找某個值。5 --**注意預先切換到當前的數據庫中。6 DECLARE TABLE_CATALOG NVARCHAR(MAX)--數據庫名7 ,TABLE_SCHEMA NVARCHAR(MAX)--架構名8 ,TABLE_NAME NVARCHAR(MAX)--表名9 ,COLUMN_NAME NVARCHAR(MAX)--列名 10 ,SQL N…

未能加載文件或程序集“Poderosa.Core

https://github.com/poderosaproject/poderosa上下載的一個開源工程,程序是在VS2012上編譯的,然后VS2015轉換后編譯失敗,報“未能加載文件或程序集“Poderosa.Core......”的錯誤 猜測是轉換的時候引用丟失了,于是添加引用 F:\...…

個人閱讀作業Week7

上了大學之后其實就沒有很多時間去讀書了,與其說軟工作業時給我們布置了一些任務,但是也是在另一方面讓我們得到了更多的知識的填補,因為平常能夠接觸的書籍很少,平常自己也是一個很不愛看書的人,所以我覺得這樣的作業…