機器學習04正則化


正則化(Regularization)


過擬合問題(Overfitting):

如果有非常多的特征,通過學習得到的假設可能能夠非常好地適應訓練集 :代價函數可能幾乎為 0),

但是可能會不能推廣到新的數據。


第一個模型是一個線性模型,欠擬合,不能很好地適應我們的訓練集;

第三個模型是一個四次方的模型,過于強調擬合原始數據,而丟失了算法的本質:預測新數據。

我們可以看出,若給出一個新的值使之預測,它將表現的很差,是過擬合,

雖然能非常好地適應我們的訓練集但在新輸入變量進行預測時可能會效果不好;而中間的模型似乎最合適。?


分類問題中也存在這樣的問題:


就以多項式理解,x 的次數越高,擬合的越好,但相應的預測的能力就可能變差。?
問題是,如果我們發現了過擬合問題,應該如何處理??
1. 丟棄一些不能幫助我們正確預測的特征。可以是手工選擇保留哪些特征,或者使用一些模型選擇的算法來幫忙(例如 PCA)。?
2. 正則化。 保留所有的特征,但是減少參數的大小(magnitude)。?


————————————————————————————————————————————————————————


代價函數:

上面的回歸問題中如果我們的模型是:?


我們可以從之前的事例中看出, 正是那些高次項導致了過擬合的產生。

所以如果能讓這些高次項的系數接近于 0 的話,我們就能很好的擬合了。


所以我們要做的就是在一定程度上減小這些參數 θ 的值, 這就是正則化的基本方法。?

我們決定要減少 θ3 和 θ4 的大小,我們要做的便是修改代價函數,在其中 θ3和 θ4 設置一點懲罰。

這樣做的話,我們在嘗試最小化代價時也需要將這個懲罰納入考慮中,并最終導致選擇較小一些的 θ3 和 θ4。

修改后的代價函數如下:?


通過這樣的代價函數選擇出的 θ3和 θ4對預測結果的影響就比之前要小許多。


假如我們有非常多的特征,我們并不知道其中哪些特征我們要懲罰。

我們將對所有的特征進行懲罰,并且讓算法自動來選擇這些懲罰的程度。

這樣的結果是得到了一個較為簡單的能防止過擬合問題的假設:?


其中 λ 又稱為正則化參數(Regularization Parameter)。

注:根據慣例,我們不對 θ0 進行懲罰。


經過正則化處理的模型與原模型的可能對比如下圖所示:


如果選擇的正則化參數 λ 過大,則會把所有的參數都最小化了,導致模型變成 hθ(x)=θ0 。

也就是上圖中紅色直線所示的情況,造成欠擬合。?


因為如果我們令λ的值很大的話, 為了使 Cost Function 盡可能的小, 所有的 θ 的值 (不包括 θ0)都會在一定程度上減小。?
但若λ的值太大了,那么 θ(不包括 θ0)都會趨近于 0,這樣我們所得到的只能是一條平行于 x 軸的直線。
?

所以對于正則化,我們要取一個合理的λ的值,這樣才能更好的應用正則化。?

回顧一下代價函數, 為了使用正則化, 讓我們把這些概念應用到線性回歸和邏輯回歸中去,那么我們就可以讓他們避免過度擬合了。


—————————————————————————————————————————————————————————


正則化線性回歸(Regularized Linear Regression)


隨機梯度下降:




正規方程:



—————————————————————————————————————————————————————————


正則化Logistic回歸(Regularized Logistic Regression)




注意:

1、雖然正則化的邏輯回歸中的梯度下降和正則化的線性回歸中的表達式看起來一樣,但由于兩者h(x)不同,所以差別很大。

2、 θ0不參與其中的任何一個正則化。


—————————————————————————————————————————————————————————————————————————————


小結:

目前大家對機器學習算法可能還只是略懂, 但是一旦你精通了線性回歸、Logistic回歸、高級優化算法和正則化技術,

坦率地說,你對機器學習的理解可能已經比許多工程師深入了。

現在,你已經有了豐富的機器學習知識, 目測比那些硅谷工程師還厲害, 或者用機器學習算法來做產品。 ?

接下來的課程中,我們將學習一個非常強大的非線性分類器,無論是線性回歸,還是Logistic回歸,都可以構造多項式來解決。

你將逐漸發現還有更強大的非線性分類器,可以用來解決多項式回歸問題。

我們接下來將將學會,比現在解決問題的方法強大 N 倍的學習算法。?



本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387267.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387267.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387267.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Adaboost算法

概述 一句話概述Adaboost算法的話就是:把多個簡單的分類器結合起來形成個復雜的分類器。也就是“三個臭皮匠頂一個諸葛亮”的道理。 可能僅看上面這句話還沒什么概念,那下面我引用個例子。 如下圖所示: 在D1這個數據集中有兩類數據“”和“-”…

Codeforces 408D Long Path (DP)

題目: One day, little Vasya found himself in a maze consisting of (n??1) rooms, numbered from 1 to (n??1). Initially, Vasya is at the first room and to get out of the maze, he needs to get to the (n??1)-th one. The maze is organized as fol…

機器學習05神經網絡--表示

神經網絡:表示(Neural Networks: Representation) 如今的神經網絡對于許多應用來說是最先進的技術。 對于現代機器學習應用,它是最有效的技術方法。 神經網絡模型是許多邏輯單元按照不同層級組織起來的網絡, 每一層…

邏輯回歸(Logistic Regression, LR)又稱為邏輯回歸分析,是分類和預測算法中的一種。通過歷史數據的表現對未來結果發生的概率進行預測。例如,我們可以將購買的概率設置為因變量,將用戶的

邏輯回歸(Logistic Regression, LR)又稱為邏輯回歸分析,是分類和預測算法中的一種。通過歷史數據的表現對未來結果發生的概率進行預測。例如,我們可以將購買的概率設置為因變量,將用戶的特征屬性,例如性別,年齡&#x…

解決SecureCRT無法用非root賬號登錄ssh

鏈接失敗,提示這個: --------------------------- SecureCRT --------------------------- 連接到會話 192.168.1.100 失敗 : The server has disconnected with an error. Server message reads: A protocol error occurred. Change of username or se…

機器學習06神經網絡--學習

代價函數 標記方法: 神經網絡的訓練樣本有 m 個 每個包含一組輸入 x 和一組輸出信號 y L 表示神經網絡層數 Sl表示每層的 neuron 個數(SL 表示輸出層神經元個數) 將神經網絡的分類定義為兩種情況: 二類分類:SL1, y0 or 1 表示哪一類&…

Logistic Regression Classifier邏輯回歸

Logistic Regression Classifier邏輯回歸主要思想就是用最大似然概率方法構建出方程,為最大化方程,利用牛頓梯度上升求解方程參數。 優點:計算代價不高,易于理解和實現。缺點:容易欠擬合,分類精度可能不高…

機器學習07應用機器學習的建議

決定下一步做什么(Deciding What to Try Next) 確保在設計機器學習系統時,能夠選擇一條最合適、最正確的道路。 具體來講,將重點關注的問題是:假如你在開發一個機器學習系統,或者想試著改進一個機器學習…

CSS3--5.顏色屬性

HTML5中添加了一些新的顏色的表示方式 1.RGBA:說得簡單一點就是在RGB的基礎上加進了一個通道Alpha。RGBA在RGB的基礎上多了控制alpha透明度的參數。以上R、G、B三個參數,正整數值的取值范圍為:0 - 255。百分數值的取值范圍為:0.0%…

邏輯回歸的通俗解釋 邏輯回歸的定位

1 邏輯回歸的定位 首先,邏輯回歸是一種分類(Classification)算法。比如說: 給定一封郵件,判斷是不是垃圾郵件給出一個交易明細數據,判斷這個交易是否是欺詐交易給出一個腫瘤檢查的結果數據,判斷…

機器學習08機器學習系統設計

首先要做什么 一個垃圾郵件分類器算法為例: 為了解決這樣一個問題,首先要做的決定是如何選擇并表達特征向量 x。 可以選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表,根據這些詞是否有在郵件中 出現,來獲得我們的特…

數學筆記1——導數1(導數的基本概念)

什么是導數導數是高數中的重要概念,被應用于多種學科。從物理意義上講,導數就是求解變化率的問題;從幾何意義上講,導數就是求函數在某一點上的切線的斜率。我們熟知的速度公式:v s/t,這求解的是平均速度&a…

python接口自動化(四)--接口測試工具介紹(詳解)

簡介 “工欲善其事必先利其器”,通過前邊幾篇文章的介紹,大家大致對接口有了進一步的認識。那么接下來讓我們看看接口測試的工具有哪些。 目前,市場上有很多支持接口測試的工具。利用工具進行接口測試,能夠提供測試效率。例如&…

機器學習09支持向量機

支持向量機(Support Vector Machines) 在監督學習中,許多學習算法的性能都非常類似,因此,重要的不是你該選擇使用學習算法 A 還是學習算法 B,而更重要的是, 應用這些算法時,所創建的大量數據在應用這些算…

數學筆記2

數學筆記2——導數2(求導法則和高階導數)和、差、積、商求導法則設uu(x),vv(x)都可導,則:(Cu)’ Cu’, C是常數(u v)’ u’ v’(uv)’ u’ v’(u/v)’ (u’v – uv’) / v21、2不解釋,下面給出3、4的推導過程乘法法則的推導過乘法法則…

機器學習10聚類

無監督學習 在非監督學習中,我們需要將一系列無標簽的訓練數據,輸入到一個算法中, 然后讓它找這個數據的內在結構。 我們可能需要某種算法幫助我們尋找一種結構。圖上的數據看起來可以分成兩個分開的點集(稱為簇)&am…

python 的筆記

語言:Python IDE:Python.IDE 需求 做出彩虹效果 顏色空間 RGB模型:光的三原色,共同決定色相 HSB/HSV模型:H色彩,S深淺,B飽和度,H決定色相 需要將HSB模型轉換為RGB模型 代碼示例&am…

關聯分析(Association analysis)

關聯分析(Association analysis) 簡介 大量數據中隱藏的關系可以以‘關聯規則’和‘頻繁項集’的形式表示。rules:{Diapers}–>{Beer}說明兩者之間有很強的關系,購買Diapers的消費者通常會購買Beer。 除…

機器學習11主成分分析

降維(Dimensionality Reduction) : 一、 降維目的: 目的一:數據壓縮(Data Compression) 目的二:數據可視化(Visualization) 二、 主成分分析(PCA) 主成分…

使用Apriori進行關聯分析(一)

使用Apriori進行關聯分析(一)大型超市有海量交易數據,我們可以通過聚類算法尋找購買相似物品的人群,從而為特定人群提供更具個性化的服務。但是對于超市來講,更有價值的是如何找出商品的隱藏關聯,從而打包促…