機器學習之回歸總結

  • 目錄
  • 1、了解線性回歸
  • 2、了解似然函數
  • 3、了解交叉驗證的原理
  • 4、梯度下降算法
    • 4.1、批量梯度下降算法(Batch Gradient Descent,簡稱BGD):
    • 4.2、隨機梯度下降算法(SGD):
    • 4.3、折中:
  • 5、了解一些參數指標
  • 6、了解Logistic回歸
  • 7、了解最小二乘法
  • 8、了解AUC指標

目錄

1、了解線性回歸

當只有一個變量的時候,可以表示為下面的式子。
這里寫圖片描述
當為多個特征時,線性回歸可以表示為下面的式子,掌握下面這個式子:
假定樣本是獨立則能得到對應的下式;這里X0是1,則能得到H(x)(可以看成是矩陣的形式)
這里寫圖片描述
上面的H(x)再加上一個誤差就能得到符合實際的表達式即下圖中的y。
了解這個y的表達式(線性回歸在實際條件下的表達式)
正態分布:正常狀態分布(可以這樣理解)
注意后面有一個誤差;誤差滿足獨立同分布的條件;且假定誤差的均值是0,方差為σ2(服從正態分布嘛)。
這里寫圖片描述

2、了解似然函數

統計學中,似然函數是一種關于統計模型參數的函數給定輸出x時,關于參數θ的似然函數L(θ|x)(在數值上)等于給定參數θ后變量X的概率:L(θ|x)=P(X=x|θ)。所以對應的也就是求似然函數的最大值。
知道求似然函數的最大值的過程:
這里寫圖片描述
求對數函數的最大值轉變為求J函數的最小值(Hθ函數是線性回歸的表達式)
這里寫圖片描述
再轉化為求駐點:似然函數最大值的求解過程->求J函數的駐點時利用梯度來逼近的(其間將關系表達式轉化為矩陣表達式)。
注意目標函數:數學含義就是求各個點到面的距離的最小累加值。
這里寫圖片描述
最終轉化為求參數的解析式,而初始的意愿就是要求θ的值(θ就是多特征情況下對應的特征方程的參數,知道這個參數后就能得到對應的x和y的映射關系!θ就如y=ax+b中的a和b一樣)。
對應的θ并不是一下子就算出來的,而是通過梯度下降算法,不斷的迭代得到的。
增加λ的意義是為了防止過擬合(相當于噪音)
這里寫圖片描述
這里寫圖片描述

知道這個懲罰因子以及它的原理
L1稱為Lasso:即懲罰因子項為|θ|。L1正則可以產生稀疏模型進而用于特征選擇。
L2稱為Ridge(嶺回歸 ):即懲罰因子為θ2。L2不具有稀疏性。
懲罰因子即代表目標函數的第二項,這里當θ比較大的時候,就造成整個J函數的值比較大(我們求的是J函數的最小值),所以這里就可以認為當θ比較大的時候,直接被抑制住(即懲罰,理解為θ是有范圍即下圖所示的圓形和正方形)。
這里寫圖片描述
這里寫圖片描述

這里寫圖片描述

3、了解交叉驗證的原理

k-折交叉驗證(k-fold crossValidation):
在機器學習中,將數據集A分為訓練集(training set)B和測試集(test set)C,在樣本量不充足的情況下,為了充分利用數據集對算法效果進行測試,將數據集A隨機分為k個包,每次將其中一個包作為測試集,剩下k-1個包作為訓練集進行訓練。(五折就相當于將數據分成5份,隨機選1份用于測試其他4份用于訓練生成一個分類率,循環進行5次得到5個分類率,求其平均值即可)
步驟:

  1. 將全部訓練集 S分成 k個不相交的子集,假設 S中的訓練樣例個數為 m,那么每一個子 集有 m/k 個訓練樣例,,相應的子集稱作{s1,s2,…,sk}。
  2. 每次從分好的子集中里面,拿出一個作為測試集,其它k-1個作為訓練集
  3. 根據訓練訓練出模型或者假設函數。
  4. 把這個模型放到測試集上,得到分類率。
  5. 計算k次求得的分類率的平均值,作為該模型或者假設函數的真實分類率。

這個方法充分利用了所有樣本。但計算比較繁瑣,需要訓練k次,測試k次。
五折、十折代表的是將數據分成五份、十份,其中多少份用于訓練數據1份用于驗證數據。
這里寫圖片描述

4、梯度下降算法

掌握梯度下降算法,還要知道梯度下降求得是局部最優解。
這里寫圖片描述
目標函數求導
這里寫圖片描述
上式少一個α值。

梯度下降的三種算法:
對于線性回歸這個模型來說采用梯度下降算法得到的局部最優解一定是全局最優解。

4.1、批量梯度下降算法(Batch Gradient Descent,簡稱BGD)

在更新每一參數時都使用所有的樣本來進行更新,也就是方程(1)中的m表示樣本的所有個數,之后通過初始的θ(需要給定的值)和學習率來不斷的迭代得到最終的θ值。
優點:全局最優解;易于并行實現;
缺點:當樣本數目很多時,訓練過程會很慢。
這里寫圖片描述
這里寫圖片描述

4.2、隨機梯度下降算法(SGD):

拿到一個數據就執行梯度下降(拿到一個數據就相當于得到一個關于θ的J函數,進而就能求對應的導數得到對應的θ值),這樣造成的結果是可以躲避局部極值,如下圖所示(跳出局部最優的原因是因為噪音影響PS:所以可以說噪音也未必是壞事)。
優點:訓練速度快;
缺點:準確度下降,并不是全局最優;不易于并行實現。
這里寫圖片描述

4.3、折中:

它的具體思路是在更新每一參數時都使用一部分樣本來進行更新,也就是方程中的m的值大于1小于所有樣本的數量,然后再執行梯度下降算法。
這里寫圖片描述

5、了解一些參數指標

了解下面的TSS、RSS(SSE)、R平方、ESS(SSR)的概念。
這里寫圖片描述

6、了解Logistic回歸

分類問題的首選算法
二分類:Logistic回歸
多分類:Softmax回歸
Softmax回歸知道即可,在Sklearn庫中,當分類數大于2時,默認的也就是Softmax回歸,所以沒必要再造一個函數。
這里寫圖片描述
這里寫圖片描述

對于簡單的線性方程,我們可以得到最終的解析式來求的答案,但是對于復雜的線性方程,我們沒有辦法獲得解析式,只能采用梯度下降的方法來不斷的逼近結果如下圖所示。
這里寫圖片描述
這里寫圖片描述
這里寫圖片描述

7、了解最小二乘法

最小二乘法:它的主要思想就是選擇未知參數,使得理論值與觀測值之差的平方和達到最小。
假設一對關系是某線性關系,且實際測量數據與該理想關系的偏差是高斯分布。
那么一個n個測量值的集合,取n-1個擬合成線性關系,用該關系預測另一個,最小二乘法可以保證:預測值和真實值的差的絕對值的期望最小。
最小二乘法與最大似然估計的解釋:
最小二乘法的核心就是權衡,因為你要在很多條的直線中間選擇,找出距離所有點的距離的平方和最小的那條直線。
極大似然估計核心就是自戀:對應似然函數理解就是給定參數θ我能得到對應的x發生的概率。就是去倒推這個過程(參考下圖中例子理解)。
最大似然估計,就是利用已知的樣本結果,反推最有可能(最大概率)導致這樣結果的參數值(似然函數的前半句內容:給定輸出X計算關于θ的似然函數值)。(1即似然函數的含義:給定輸出X計算關于θ的似然函數值就等于給定θ值在X事件發生的概率)
這里寫圖片描述
這里寫圖片描述
這里寫圖片描述
這里寫圖片描述

8、了解AUC指標

了解AUC(Area Under Curve)的含義,并且知道ROC(Receiver Operating Characterstic):受試者工作特征曲線 (receiver operating characteristic curve,簡稱ROC曲線),又稱為感受性曲線(sensitivity curve)。得此名的原因在于曲線上各點反映著相同的感受性,它們都是對同一信號刺激的反應,只不過是在兩種不同的判定標準下所得的結果而已。
使用AUC(即曲線下方的面積)來度量分類器的好壞,給定的閾值不同,造成TP\FP的值的不同,也就造成TPR/FPR值的不同,最終造成AUC的值的不同,分類器的效果也就不同,往往將equal error rate點作為閾值的劃分依據。
這里寫圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456468.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456468.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456468.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

html中的url、href、src的區別

url不是屬性,src和href是屬性,src用于替換當前元素,href用于在當前文檔和引用資源之間確立聯系,也就是說src引用的路徑是img自己的路徑,href引用的路徑是要跳轉到的地方。 URL:Uniform Resource Locators&…

SSIS 包部署錯誤 0xC0010014

SSIS 包部署錯誤 0xC0010014 Reinhard 在部署 SSIS 包時,提示如下錯誤。 由于錯誤 0xC0010014“發生了一個或多個錯誤。在此消息之前應有更為具體的錯誤消息,對這些錯誤進行詳細說明。此消息用作遇到錯誤的函數的返回值。”,無法加載包。當 C…

Android性能優化-App后臺優化

原文鏈接 Background Optimizations 前言 后臺進程是內存和電池敏感的。一個隱式的broadcast可能會啟動很多監聽它的后臺進程,即使這些進程可能做得工作不多。這可能丟設備性能和用戶體驗都有比較大的影響。 為了緩解這種問題,7.0(API 24&…

機器學習之決策樹與隨機森林

目錄1、了解熵、條件熵、互信息的概念及公式1.1、熵1.2、條件熵1.3、信息增益/互信息 2、了解決策樹2.1、了解決策樹的概念和特點以及和熵的關系2.2、了解樹生成的過程2.3、了解決策樹三種算法的區別2.4、了解決策樹的損失函數2.5、了解解決決策樹過擬合的方法2.6、了解后剪枝的…

JSON(JavaScript Object Notation) 格式

JSON(JavaScript Object Notation) 是一種輕量級的數據交換格式。 它使得人們很容易的進行閱讀和編寫。同時也方便了機器進行解析和生成。JSON采用完全獨立于程序語言的文本格式,但是也使用了類C語言的習慣。 json是 JavaScript Object Notation 的首字母縮寫&…

synchronized 的理解

第一種:package com.ucmed.zsyy.util;/*** Created by ucmed on 2017/2/8.*/public class DirtyRead {private String username "zjkj";private String password "123";public synchronized void setValue(String username, String password)…

機器學習之提升算法

1、知道提升、梯度提升是什么意思1.1、提升1.2、梯度提升1.3、了解提升算法的過程 2、殘差與殘差平方和(residual sum of squares)3、了解GBDT算法4、了解XGBoost算法5、了解Adaboost算法5.1、Adaboost算法的原理5.2、例子 6、偏差和方差 1、知道提升、梯…

Jsoup遍歷ul li下的鏈接信息實例

2019獨角獸企業重金招聘Python工程師標準>>> Document doc;try {String URL "www.baidu.com";doc Jsoup.connect(URL).get();Elements ElementsUl doc.getElementsByTag("ul");for (Element elementLi : ElementsUl) {Elements provinceEl …

兩篇波蘭地區重金屬污染地區土壤微生物多樣性的研究

環境微生物(包括方興未艾的腸道微生物)在不同的系統中發揮著的生態作用逐漸被意識到,我們對環境微生物實際上仍舊知之甚少,其多樣性問題仍舊是一個非常基礎和重要的課題。這次讀的兩篇文章都是關于波蘭地區重金屬污染地區的土壤微…

jquery中的 $(function(){})

$(function(){})的區別:$(function(){}) 是 $(document).ready(function(){}) 的簡寫,用來在DOM加載完成之后執行一系列預先定義好的函數。 需要注意與(function(){})相比,(function(){})表示一個匿名函數。function(arg){...}定義了一個參數…

機器學習之支持向量機(SVM)總結

文章目錄1、知道SVM相關的各種概念2、知道目標函數、損失函數、正則項的意義2.1、目標函數2.2、損失函數2.3、正則化(添加噪音避免過擬合)3、了解SVM算法原理4、知道SVM的目標函數5、知道SVM的損失函數以及公式6、知道SVM支持向量機的計算過程6.1、推導過…

在CentOS上搭建PHP服務器環境

您也可以使用一鍵自動部署環境的工具,請參見網友開發的這個工具 http://www.centos.bz/2013/08/ezhttp-tutorial/安裝apache:yum install httpd httpd-devel 啟動apache:/etc/init.d/httpd start此時輸入服務器的IP地址,應該看到apache的服務頁面&#x…

jQuery之滾動事件$(window).scroll(function()

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>滾動事件</title><script src"https://code.jquery.com/jquery-2.2.4.min.js"></script><style>img{position:fixe…

《瘋狂Java講義》(二十九)---- JDBC

JDBC編程步驟加載數據庫驅動Class.forName(driverClass). 例如&#xff1a;Class.forName("oracle.jdbc.driver.OracleDriver"); 2. 通過DriverManager獲取數據庫連接。 DriverManager.getConnection(String url, String user, String pwd); 3. 通過Connection對象創…

機器學習之聚類算法的原理推導及相關知識總結

文章目錄1、知道幾個關于"差"的概念2、理解相似度度量的各種方法和相互關系2.1、歐氏距離2.2、jaccard相似系數2.3、余弦相似度2.4、Pearson相似系數2.5、相對熵3、掌握掌握K-Means算法3.1、知道聚類的思想3.2、K-Means算法原理3.3、知道K-Mediods聚類3.4、如何選取K…

Flex 布局教程:語法

Java數組聲明的三種方式 第一種(聲明并初始化)&#xff1a; 數據類型[] 數組名{值,值,...}; 例&#xff1a;int[] a {1,2,3,4,5,6,7,8}; 第二種(聲明后賦值)&#xff1a; 數據類型[] 數組名 new 數據類型[數組長度]; 數組名[下標1]值…

注意:匿名函數調用直接加載函數名setInterval(move,30)

setInterval要求第一個參數必須是含Javascript命令的字符串或函數對象&#xff0c;所以 setInterval("move()",300) 以及 setInterval(move,300) 這兩個都是正確的。 而 setInterval(move(),300) 當Javascript運行到這個語句時&#xff0c;會立即執行move這個函數&am…

vue import組件的使用

vue import組件的使用 1新建/src/component/firstcomponent.vue <template><div id"firstcomponent"><h1>I am a title.</h1></div> </template>2在app.vue引入組件 并且注冊 <script> import firstcomponent from ./comp…

牽絲戲

余少能視鬼&#xff0c;嘗于雪夜野寺逢一提傀儡翁&#xff0c;鶴發襤褸&#xff0c;唯持一木偶制作極精&#xff0c;宛如嬌女&#xff0c;繪珠淚盈睫&#xff0c;惹人見憐。 時云彤雪狂&#xff0c;二人比肩向火&#xff0c;翁自述曰&#xff1a;少時好觀牽絲戲&#xff0c;耽…

機器學習之EM算法的原理推導及相關知識總結

文章目錄1、知道先驗概率和后驗概率2、了解高斯混合模型GMM3、通過最大似然估計推導EM算法的過程的實例4、EM算法5、知道pLSA模型1、知道先驗概率和后驗概率 先驗概率&#xff08;prior probability&#xff09;是指根據以往經驗和分析得到的概率&#xff08;理解為自定義概率…