R--線性回歸診斷(一)

線性回歸診斷--R

?【轉載時請注明來源】:http://www.cnblogs.com/runner-ljt/

??? Ljt ? 勿忘初心 ?無畏未來

? ? 作為一個初學者,水平有限,歡迎交流指正。

?


?

? 在R中線性回歸,一般使用lm函數就可以得到線性回歸模型,但是得到的模型到底合不合適?在我們使用所得到的線性模型之前就需要進行回歸診斷。

? ??線性回歸的診斷,主要是檢驗線性回歸模型的假設是否成立。

? ? 線性回歸模型 ? ?y=Θ01x12x2+.......+Θmxm+ε ? ?(自變量與因變量之間是線性關系)

? ? 基本假設:

(1)隨機干擾項?ε 服從零均值,同方差,零協方差(相互獨立)的正態分布

? ? ? ? ? ?E(εi)=0 ?; ??var(εi)=σ2 ??; ??cov(εi ,?εj)=0 ? ? ;

? ? ? ? ? ?εi~N(0,σ2)

(2)隨機干擾項?ε 與解釋變量間不相關

? ? ? ? ? ?cov(Xi , εi) =0

?


?

(一)顯著性檢驗

? (1)回歸方程顯著性 F 檢驗 :?看自變量 X1?, X2?.....Xm ?從整體上對隨機變量Y是否有明顯的影響 。

? ? ? ? ? 原假設 H0:Θ1 2=.....=Θm=0 ? ? ? ?(H0?若被接受則表明隨機變量Y與X1?, X2?.....Xm?之間的關系由線性回歸模型表示不合適)

? ? ? ? ? P值<α ?: ?拒絕原假設 。即在顯著性水平?α 下,Y 與?X1?, X2?.....Xm 有顯著的線性關系,回歸方程是顯著的。(自變量全體對因變量產生線性影響)

?

? (2)回歸系數顯著性 t 檢驗:看單個的自變量?Xi 對Y是否有明顯影響。

? ? ? ? ? 原假設 ? H0i?:Θi?=0 ? ? ? ? ? ?(H0i?若被接受則表明自變量Xi 對因變量Y的線性效果不顯著)

? ? ? ? ??P值<α ?: ? 拒絕原假設 。即在顯著性水平?α 下,Y 與?Xi?有顯著的線性關系。

?

? ? ? ? ?對于一元線性回歸這兩種檢驗是等價的;

? ? ? ? ?對于多元線性回歸,這兩種檢驗是不等價的:

? ? ? ? ?F檢驗顯著,說明Y對自變量X1?, X2?.....Xm 整體的線性回歸效果是顯著的,但不等于Y對每個自變量Xi 的效果都顯著;反之,某個或某幾個Xi 的系數不顯著,回歸方程顯著性的F檢驗仍然有可能是顯著的。由于某些自變量不顯著,因而在多元回歸中并不是包含在回歸方程中的自變量越多越好,需要剔除對Y無顯著影響的自變量。

?

(二)擬合優度

? ? ? ? 擬合優度用于檢驗回歸方程對樣本觀測值的擬合程度。

? ? ? ? 樣本決定系數 R2?= SSR/SST = 1 - SSE/SST ? ? ?(R2屬于[0,1]?)

? ? ? ? ? ? ? R2 越接近 1 ,表明回歸擬合的效果越好;

? ? ? ? ? ? ? R2?越接近 0 ,表明回歸擬合的效果越差。

? ? ? ? 與F檢驗相比,R2 可以更清楚直觀地反映回歸擬合的效果,但是并不能作為嚴格的顯著性檢驗。需要指出的是,擬合優度并不是檢驗模型優劣的唯一標準,有時為了使模型從結構上有較合理的經濟解釋,在樣本量n 較大時,R2 等于0.7左右我們也給回歸模型以肯定態度。需要注意的是?R2與回歸方程匯中自變量的數目以及樣本量n有關,當樣本量n與自變量的個數接近時,R2易接近于1,其中隱含著一些虛假的成分。

?


?

下面結合實例對R語言中線性擬合函數lm的結果進行分析

?

?

> 
> 
> head(bank)y     x1     x2    x3     x4
1 1018.4  96259 2239.1 50760 1132.3
2 1258.9  97542 2619.4 39370 1146.4
3 1359.4  98705 2976.1 44530 1159.9
4 1545.6 100072 3309.1 39790 1175.8
5 1761.6 101654 3637.9 33130 1212.3
6 1960.8 103008 4020.5 34710 1367.0
> 
> fline<-lm(y~x1+x2+x3+x4,data=bank)
> summary(fline)Call:
lm(formula = y ~ x1 + x2 + x3 + x4, data = bank)Residuals:Min      1Q  Median      3Q     Max 
-487.35  -78.89   -2.65  137.02  403.78 Coefficients:Estimate Std. Error t value Pr(>|t|)    
(Intercept) -4.168e+03  1.193e+03  -3.495 0.002998 ** 
x1           5.842e-02  1.216e-02   4.805 0.000194 ***
x2           4.142e-01  3.218e-02  12.871 7.41e-10 ***
x3          -1.384e-02  8.520e-03  -1.624 0.123826    
x4          -7.062e-01  1.750e-01  -4.035 0.000959 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 217.7 on 16 degrees of freedom
Multiple R-squared:  0.9982,	Adjusted R-squared:  0.9978 
F-statistic:  2222 on 4 and 16 DF,  p-value: < 2.2e-16> 
> 

?

  

回歸結果的診斷:

?(1)F-statistic

? ? ? ? ?回歸方程顯著性 F 檢驗中的F統計量,其P值<2.2e-16<0.05 ,表明Y 與?X1?, X2?,X3,X4有顯著的線性關系,回歸方程整體是顯著的。

?(2)Coefficients

? ? ? ? ?Estimate 即回歸系數的估計值,其對應的 P(>|t|)為各回歸系數t檢驗的P值。

? ? ? ? ?從回歸結果看,X3的P值為0.123826>0.05,表明X3對Y沒有顯著影響,應考慮刪除變量X3;其他三個變量的P值都<0.05,對Y 都有顯著的影響。

?

? ?---------以上兩個回歸檢驗的結果也表明,自變量整體對于因變量有顯著影響,并不表明每個自變量對因變量都有顯著影響。

?

?(3)Multiple R-squared ?; ? Adjusted R-squared

? ? ? ? ?分別表示 ‘擬合優度’ ?,‘修正的擬合優度’

? ? ? ? ?擬合優度值為 0.9982 ?很接近于 1 ,表明回歸方程對樣本觀測值的擬合程度較高。

?


?

?

相關圖形診斷:

? (1)殘差圖?

? ? ? ? ? 殘差圖分析法是一種直觀、方便的分析方法。它以殘差ei?為縱坐標,以其他適宜的變量(如樣本擬合值)為橫坐標畫散點圖,主要用來檢驗是否存在異方差。

? ? ? ? ? 一般情況下,當回歸模型滿足所有假定時,殘差圖上的n個點的散布應該是隨機的,無任何規律。如果殘差圖上的點的散布呈現出一定趨勢(隨橫坐標的增大而增大或減小),則可以判斷回歸模型存在異方差。

? ? ? ? ? ?異方差:某一因素或某些因素隨著解釋變量觀測值的變化而對被解釋變量產生不同的影響,導致隨機誤差產生不同方差。

? ? ? ? ? ? ? ? ? ? ? ?當存在異方差時,普通最小二乘估計存在以下問題:

? ? ? ? ? ? ? ? ? ? ? ?(i) ?參數估計值雖然是無偏的,但不是最小方差線性無偏估計;

? ? ? ? ? ? ? ? ? ? ? ?(ii) 參數的顯著性檢驗失效;

? ? ? ? ? ? ? ? ? ? ? ?(iii) 回歸方程的應用效果極不理想。

?

? (2)Q-Q圖

? ? ? ? ? Q-Q圖主要用來檢驗樣本是否近似服從正態分布。

? ? ? ? ? 對于標準狀態分布而言,Q-Q圖上的點近似在Y=X直線附近。

?

? (3)標準化殘差方根散點圖

? ? ? ? ? 此圖類似于殘差圖,只是其縱坐標變為了標準化殘差的絕對值開方。

? ? ? ?

? (4)Cook距離圖

? ? ? ? ? 庫克距離用來判斷強影響點是否為Y的異常值點。

? ? ? ? ? 一般認為 ?當D<0.5時認為不是異常值點;當D>0.5時認為是異常值點。

? ??

> 
> par(mfrow=c(2,2))
> plot(fline,which=c(1:4))
> 

?

? ? ? ? ? ? ? ? ? ? ? ? ? ??

?

? ?從回歸的四個圖形結果來看:

? ? ? ? ? 殘差圖 ? Residuals vs Fitted ?: ?圖上的點基本服從隨機分布,可以認為不存在異方差的情況;

? ? ? ? ? 標準Q-Q圖 ?Normal Q-Q ? ? ? : ?圖上的點基本都在y=x直線附件,可認為樣本近似服從正態分布;

? ? ? ? ? 標準化殘差方根散點圖 Scale-Location:類似與殘差圖,點的分布基本是隨機的。

? ? ? ? ? 庫克距離圖 Cook‘s distance ? : ?最大的庫克距離為0.3左右,可以認為沒有異常值點。

? ? ? ? ? ? ??

? ?

? ??

?

?

?

?

?

?

?

?

?

?

?

?

?

?


?

轉載于:https://www.cnblogs.com/runner-ljt/p/4581622.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/257166.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/257166.shtml
英文地址,請注明出處:http://en.pswp.cn/news/257166.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CSS屬性(根據繼承性分為兩類)

一、可繼承屬性 1》所有標簽可繼承&#xff1a; visibility:行高 cursor: 2》內聯標簽可繼承&#xff1a; line-height:行高 color:文字顏色 font-family:文字字體 font-size:文字大小 font-weight:文字加粗 text-decoration:文字下劃線 3》塊級標簽可繼承&#xff1a; text-in…

妙趣橫生的算法--棧和隊列

棧 棧的特點是先進后出&#xff0c;一張圖簡單介紹一下。 #include "stdio.h" #include "math.h" #include "stdlib.h" #define STACK_INIT_SIZE 20 #define STACKINCRE…

win10系統開不了機

電腦裝了雙系統&#xff0c;從ubuntu切回win10系統后&#xff0c;win10系統開不了機&#xff0c;一直轉圈&#xff0c;修復結果是什么C:\WINDOWS\System32\Logfiles\Srt\SrtTrail.txt問題&#xff0c;是了網上的常用方法都沒成功。 最后我的解決方案&#xff1a;強制關機后開機…

Android SDK打包

2015年6月18日 14:38:49 星期四 eclipse: 1. 將寫好的代碼上傳版本庫 2. 刪除 /bin/* 3. eclipse->project->clean... 4. 上一步自動生成 /bin/xx.jar 5. 復制/bin/xx.jar 到 /libs/xx.jar 6. 刪除 /src/* 7. 連同demo和剛才的工程文件夾壓縮給到對方(這樣可以避免包命…

MySQL 5.7.11 重置root密碼

1.修改/etc/my.conf&#xff0c;添加參數skip-grant-tables 2.重啟mysql service mysqld stop service mysqld start 3.用root 直接登錄 [rootbogon ~]# mysql -uroot Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 4 Server versio…

resure挽救筆記本系統和一些相關的操作記錄

使用fedora23很久了, 但是感覺不是很流暢, 出現了一些不太穩定的體驗, 所以想改到centos7. 因為centos7的很多東西 跟 fedora23 很相近了. 所以應該是無縫過渡是選擇32位的系統還是選擇64位的系統?還是要使用 32位的 它是90%的人的選擇使用, 是普通人的通用選擇, 幾乎支持linu…

2021-06-08

opencv無法讀取mp4文件opencv讀取mp4文件時&#xff0c;總是VideoCapture.isopen()返回0,即無法打開cap。解決方法&#xff0c;將opencv安裝包的opencv_videoio_ffmpeg451_64文件復制進工程中。

Web網頁布局的主要方式

一、靜態布局&#xff08;static layout&#xff09; 即傳統Web設計&#xff0c;網頁上的所有元素的尺寸一律使用px作為單位。 1、布局特點 不管瀏覽器尺寸具體是多少&#xff0c;網頁布局始終按照最初寫代碼時的布局來顯示。常規的pc的網站都是靜態&#xff08;定寬度&#xf…

HDU 3966 Aragorn's Story (樹鏈點權剖分,成段修改單點查詢)

題目鏈接&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid3966 樹鏈剖分的模版&#xff0c;成段更新單點查詢。熟悉線段樹的成段更新的話就小case啦。 1 //樹鏈剖分 邊權修改 單點查詢2 #include <iostream>3 #include <cstring>4 #include <algorithm&…

微信分享無響應的解決

微信分享無響應的解決 最近使用友盟的社會化分享&#xff0c;集成到程序中進行分享功能的開發。 可是一開始還是可以正常使用&#xff0c;今天突然發現微信分享&#xff08;好友分享和朋友圈分享&#xff09;均是點擊沒有響應&#xff0c;也就是點擊后&#xff0c;沒有任何回饋…

x64電腦連接x32共享打印機

下載64位打印機驅動到64位電腦&#xff0c;在連接32位共享打印機出錯時出現在本地尋找相關inf文件&#xff0c;此時將64位打印機驅動解壓(不在64位本地安裝)并找到相應inf文件&#xff0c;載入即可連接成功。

HTML中的br標簽講解(菜鳥)

br標簽&#xff1a;如何在HTML中換行&#xff1f;可以使用br標簽 1.br標簽作用&#xff1a;換行 2.br標簽格式&#xff1a;<br/> 3.br標簽的注意點&#xff1a; 3.1多個br標簽可以連續使用&#xff0c;使用了多少個br標簽就會換多少行 3.2由于HTML的作用就是用來給文本添…

Cocos2d-3.x版的HelloWorld工程分析 (二)

我們HelloWorld 從applicationDidFinishLaunching()后&#xff0c; 大部分人都會從這部分代碼開始研究&#xff0c;如果想要研究main函數 如何調用applicationDidFinishLaunching() 傳送門 http://blog.csdn.net/hiwoshixiaoyu/article/details/51472707 #include "App…

安卓中bundle的使用

Bundle類用作攜帶數據&#xff0c;它類似于Map&#xff0c;用于存放key-value形式的值&#xff0c;相對于Map&#xff0c;它提供了各種常用類型的putXxx()/getXxx()方法&#xff0c;Bundle的內部實際上是使用了HashMap類型的變量來存放PutXxx()方法存入的值。 SDK里是這樣描述&…

NO.1 python_人工智能_學習路線

***##學習路線&#xff1a;* 1.python基礎 計算機組成原理、python開發環境、python變量、流程控制語句、文件操作、異常處理、模塊與包、飛機大戰游戲制作等 2.python高級應用 網絡編程、并發編程、數據庫編程、正則表達式、Linux系統應用、函數的高級應用、python的語法進階…

wds+mdt 分布式自動部署 操作系統

一、 安裝準備 1、工具的準備 首先介紹本次項目所涉及到的內容&#xff1a; MDT Microsoft Deployment Toolkit 2012&#xff08;簡稱MDT 2012&#xff09;是微軟最新一代部署工具&#xff0c;通過它可以自動完成桌面和服務器部署的推薦操作進程和工具&#xff0c;MDT主要…

iOS開發網絡篇—數據緩存

iOS開發網絡篇—數據緩存 一、關于同一個URL的多次請求 有時候&#xff0c;對同一個URL請求多次&#xff0c;返回的數據可能都是一樣的&#xff0c;比如服務器上的某張圖片&#xff0c;無論下載多少次&#xff0c;返回的數據都是一樣的。 上面的情況會造成以下問題 &#xff08…

[WinError 10061] 由于目標計算機積極拒絕,無法連接錯誤解決辦法

爬蟲的時候會經常出現"[WinError 10061] 由于目標計算機積極拒絕&#xff0c;無法連接"錯誤這種情況&#xff0c;有可能是LAN口設置不正確 我是在爬取全國天氣情況的時候出現的這種錯誤&#xff0c;后面調了以后可以了1.控制面板——網絡和 Internet—— Internet選項…

Chrome瀏覽器設置小窗口視頻

快捷工具先安裝1.28版本后用1.31版本替換&#xff0c;以實現視頻彈窗和雙擊關閉標簽頁功能。 首先下載Chrome擴展快捷工具1.28版的CRX安裝包&#xff1a;http://pan.baidu.com/s/1pJ4T4td&#xff1b; 然后拖放到chrome擴展管理頁面中安裝。 接著&#xff0c;下載打包好的快捷…

這門課有什么用?

每個老師都苦惱于學生常問的問題&#xff1a;“某某課學了有什么用&#xff1f;”老師費勁巴拉解釋一通&#xff0c;結果還是&#xff1a;然并卵。 一門課有什么用&#xff0c;很難解釋得令人信服&#xff0c;因為這和人的認知水平有關。認知水平達不到&#xff0c;解釋的多深入…