【機器學習】總結:線性回歸求解中梯度下降法與最小二乘法的比較

在線性回歸算法求解中,常用的是最小二乘法與梯度下降法,其中梯度下降法是最小二乘法求解方法的優化,但這并不說明梯度下降法好于最小二乘法,實際應用過程中,二者各有特點,需結合實際案例具體分析。

最后有兩份最小二乘法和邏輯斯特推導方法

1.最小二乘法求解線性回歸

線性回歸的基本模型設定為:

在此基礎上構建代價函數:

通過代價函數 求偏導并令其等于零,所得到 的即為模型參數的值:

最終得到:

這便是由最小二乘法所求得的模型參數θ的值。這里需要滿的條件是(XTX)-1存在的情況。在機器學習中,(XTX)-1不可逆的原因通常有兩種,一種是自變量間存在高度多重共線性,例如兩個變量之間成正比,那么在計算(XTX)-1時,可能得不到結果或者結果無效;另一種則是當特征變量過多,即復雜度過高而訓練數據相對較少(m小于等于n)的時候也會導致(XTX)-1不可逆。(XTX)-1不可逆的情況很少發生,如果有這種情況,其解決問題的方法之一便是使用正則化以及嶺回歸等來求最小二乘法。

2.梯度下降法求解線性回歸

梯度下降法是一種在學習算法及統計學常用的最優化算法,其思路是對theta取一隨機初始值,可以是全零的向量,然后不斷迭代改變θ的值使其代價函數J(θ)根據梯度下降的方向減小,直到收斂求出某θ值使得J(θ)最小或者局部最小。其更新規則為:

其中alpha為學習率。J(θ)對θ的偏導決定了梯度下降的方向,將J(θ)帶入更新規則中得到:

對于上式由于每一次迭代都需要遍歷所有訓練數據一次,如果訓練數據龐大,則復雜度比較高,便使得收斂速度變得很慢,所以被稱作批量梯度下降法。當更新參數的時候,不必遍歷全部訓練數據,只要一個訓練數據就可以,這種方法會比較快地收斂,所以區別于批量梯度下降法被稱為隨機梯度下降法。

梯度下降法中學習率alpha代表了逼近最低點的速率,既不能太大也不能太小,過大可能會出現不斷地在最低點附近反復震蕩的情況,無法收斂;而過小,則導致逼近的速率太慢,即需要迭代更多次才能逼近最低點。因此,可以用一些數值試驗。

另外,在解決實際問題中,往往會出現x里的各個特征變量的取值范圍間的差異非常大,如此會導致在梯度下降時,由于這種差異而使得J(θ)收斂變慢,特征縮放便是解決該類問題的方法之一,特征縮放的含義即把各個特征變量縮放在一個相近且較小的取值范圍中,例如-1至1,0.5至2等,其中,較簡單的方法便是采用均值歸一化,也就是標準化處理。

3. 二者的應用比較

相對于最小二乘法來說,梯度下降法須要歸一化處理以及選取學習速率,且需多次迭代更新來求得最終結果,而最小二乘法則不需要。

相對于梯度下降法來說,最小二乘法須要求解(XTX)-1,其計算量為o(n3),當訓練數據集過于龐大的話,其求解過程非常耗時,而梯度下降法耗時相對較小。

所以,當模型相對簡單,訓練數據集相對較小,用最小二乘法較好;對于更復雜的學習算法或者更龐大的訓練數據集,用梯度下降法較好,一般當特征變量小于10的四次方時,使用最小二乘法較穩妥,而大于10的四次方時,則應該使用梯度下降法來降低計算量。

?

## 個人推導筆記僅供參考

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456111.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456111.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456111.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

struts2學習(3)struts2核心知識II

一、struts.xml配置:                                                   1.分模塊配置方法: 比如某個系統多個模塊,我們把資產管理模塊和車輛管理模塊,分開,在總…

【機器學習】邏輯斯蒂回歸概率計算和手動計算對比

二分類,邏輯斯蒂回歸概率計算 import numpy as np from sklearn import datasets from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_splitX,y datasets.load_iris(True)cond y!2X X[cond] y y[cond]resul…

WPF快速指導2:模板

WPF快速指導2:模板 本文摘要: 1:模板作用; 2:樣式模板; 3:數據模板; 4:如何使用ControlTemplate; 5:如何使用DataTempla…

五個最佳媒體格式轉換器

我們經常會遇到下載的視頻文件格式不對,無法在其他播放設備(如手機、DVD)中使用的問題,現在,我們介紹五個功能強大且易于使用的媒體轉換器,用于轉換不同類型的視頻文件。   Super (Windows) Super是一個免…

【機器學習】六種算法在人臉補全中的應用比較(K緊鄰,線性,決策樹,嶺回歸,套索回歸,ElasticNet)

需求: 根據人的上半邊臉預測下半邊臉,用各種算法取得的結果與原圖比較 思考: 這是一個回歸問題,不是分類問題(人臉數據不固定) 數據集一共包含40個人,每一個人10張照片,分布規律 每…

性能優化之NSDateFormatter

為什么要優化NSDateFormatter?首先,過度的創建NSDateFormatter用于NSDate與NSString之間轉換,會導致App卡頓,打開Profile工具查一下性能,你會發現這種操作占CPU比例是非常高的。據官方說法,創建NSDateForma…

QuickTime文件格式解析

QuickTime文件格式解析Peter Lee 2008-06-14 一、簡介 QuickTime是Apple公司開發的一套完整的多媒體平臺架構,可以用來進行多種媒體的創建,生產,和分發,并為這一過程提供端到端的支持:包括媒體的實時捕捉,…

python的數據類型轉換

數據類型轉換 將數據由當前類型變化為其他類型的操作就是數據類型轉換。數據類型轉換分為兩類,分別是自動數據類型轉換 和 強制數據類型轉換。 自動轉換(隱式轉換) 自動轉換時程序根據運算要求進行的轉換,不許要人工干預。 1.自動類型轉換不需要人工干…

Linux文件屬性及如何修改文件屬性

ls -al:顯示文件的文件名與相關屬性并列出所有文件詳細的權限與屬性 dr-xr-x---. 7 root root 4096 Apr3 12:31 . 權限 連接 所有者 用戶組 文件容量 修改日期 文件名 第一個字符代表這個文件是“目錄,文件&#x…

SyntaxError:identifier starts immediately after numeric literal

1、錯誤描寫敘述2、錯誤原因因為在改動方法傳參的過程,須要傳個id,可是這個id是字符串類型,傳入的是數值型3、解決的方法在傳參時,須要加入“”,變成字符串類型User.modify("id");

python中的運算和運算符

運算和運算符 運算: 由一個以上的值經過變化得到新值得過程,就是運算。 運算符: 用于運算的符號,就是運算符 運算的分類: 1.算數運算 2.比較運算/關系運算 3.賦值運算 4.邏輯運算 5.位運算 6.成員運算 7.身份運算算術…

【數據分析】reshape(-1,1)和numpy的廣播機制

在創建DataFrame的時候常常使用reshape來更改數據的列數和行數。 reshape可以用于numpy庫里的ndarray和array結構以及pandas庫里面的DataFrame和Series結構。 源數據 reshape函數 reshape(行,列)可以根據指定的數值將數據轉換為特定的行數和…

藍橋杯-組素數-java

/* (程序頭部注釋開始) * 程序的版權和版本聲明部分 * Copyright (c) 2016, 廣州科技貿易職業學院信息工程系學生 * All rights reserved. * 文件名稱: 藍橋杯賽題 * 作 者: 彭俊豪 * 完成日期&#xf…

AVI文件規范

AVI文件規范PeterLee 2007-10-14 一、AVI文件簡介 AVI的英文全稱為Audio Video Interleaved,即音頻視頻交錯格式,是將語音和影像同步組合在一起的文件格式。AVI于1992年被Microsoft公司推出,隨Windows3.1一起被人們所認識和熟知。AVI文件格式…

python中的流程控制

流程控制 流程: 計算機執行代碼的順序,就是流程。 流程控制: 對計算機代碼執行順序的控制,就是流程控制。 流程分類: 流程控制一共分為三類,分別是 順序結構、分支(選擇)結構、循環結構。 順序結構 順序…

tomcat jdbc SlowQueryReport的實現解讀

為什么80%的碼農都做不了架構師?>>> ##序 tomcat提供了JdbcInterceptor可以用來監控jdbc的執行情況,默認提供了好幾個現成的interceptor可以用,SlowQueryReport以及SlowQueryReportJmx就是其中的兩個。 ##JdbcInterceptor的基本原…

【機器學習】Bagging和Boosting的區別(面試準備)

Baggging 和Boosting都是模型融合的方法,可以將弱分類器融合之后形成一個強分類器,而且融合之后的效果會比最好的弱分類器更好。 Bagging: 先介紹Bagging方法: Bagging即套袋法,其算法過程如下: 從原始樣本集中抽取訓…

python中的循環結構

循環結構 循環結構可以減少源程序重復書寫的工作量(代碼量),用來描述重復執行某段算法的問題,這是程序設計中最能發揮計算機特長的程序結構。 Python中循環結構分為兩類,分別是 while 和 for .. in while 格式1: num1,num2 3…

線性判別結合源碼分析LDA原理

1. LDA的思想 LDA線性判別分析也是一種經典的降維方法,LDA是一種監督學習的降維技術,也就是說它的數據集的每個樣本是有類別輸出的。這點和PCA不同。PCA是不考慮樣本類別輸出的無監督降維技術。LDA的思想可以用一句話概括,就是“投影后類內方…

RIFF文件規范

RIFF文件規范Peter Lee 2007-10-02 摘要:RIFF全稱為資源互換文件格式(Resources Interchange File Format),RIFF文件是windows環境下大部分多媒體文件遵循的一種文件結構,常見的如WAV文件、AVI文件等。RIFF可以看成一種…