作者:夏雨驕陽 ??封面:自己想吧
1
簡單線性回歸
1根據研究目的確定因變量和自變量。2判斷有無異常值。通過繪制散點圖直觀觀察;亦可通過線性回歸的【統計】→【個案診斷】→【所有個案】進行分析,若標準殘差超過[-3,3],則可視為異常值。如果發現異常值,則首先應該檢查是否是數據收集或錄入方面的錯誤,如是則應及時糾正。如不是數據收集或錄入方面的錯誤,則需根據實際情況,選擇剔除或者保留異常值。
3判斷數據是否滿足簡單線性回歸假設條件。第一,線性(linear),因變量與自變量呈線性關系,通過繪制散點圖判斷。
第二,獨立性(independent),任意兩個觀察值之間相互獨立,通過線性回歸的【統計】→【德賓-沃森】進行分析,一般來說Durbin-Waston檢驗值分布在0-4之間,越接近2,觀察值相互獨立的可能性越大。
第三,殘差正態性(normal),隨機誤差近似正態性,可通過直方圖或者P-P圖判斷殘差是否符合正態分布。
第四,通過線性回歸的【圖】→【產生所有部分圖】,即可得到殘差隨著估計值的變化趨勢,若所有點均勻分布于直線Y=0的兩側,則可認為方差齊性。
4估計回歸模型參數,建立模型。5對模型進行假設檢驗。對回歸模型進行假設檢驗一般使用方差分析法,對回歸系數進行假設檢驗一般使用t檢驗方法。
2
多重線性回歸
1根據研究目的確定因變量和自變量。2判斷有無異常值。通過線性回歸-統計-個案診斷,線性回歸-保存-勾選學生化刪除、庫克距離、杠桿值,根據新生成的學生化刪除殘差、庫克距離、杠桿值來判斷。學生化刪除殘差的值在-3至3的范圍內,庫克距離均小于1,杠桿值均均小于0.2,不存在異常值。如果發現異常值,則首先應該檢查是否是數據收集或錄入方面的錯誤,如是則應及時糾正。如不是數據收集或錄入方面的錯誤,則需根據實際情況,選擇去除異常值、轉換異常值的變量,或者選用非參數分析法、最小一乘法來處理。
3判斷數據是否滿足多重線性回歸假設條件。第一,因變量與所有自變量之間是否存在線性關系。通過建立未標化預測值(PRE_1)和學生化殘差(SRE_1)的散點圖判斷,未標化預測值(PRE_1)和學生化殘差(SRE_1)的散點圖呈水平帶狀,則滿足因變量與所有自變量之間存在線性關系的假設。
第二,因變量與每一個自變量之間是否存在線性關系。通過線性回歸的【圖】→【產生所有部分圖】中的散點圖判斷。
第三,方差齊性。通過線性回歸的【ANOVA】表的Sig值判斷,小于0.05為方差齊性,大于0.05為方差不齊。
第四,各自變量之間是相互獨立的。通過線性回歸的→【統計】→【共線性診斷】的結果,容許度越接近1,多重共線性越弱,膨脹因子越接近1,多重共線性越弱;膨脹因子小于10為弱多重共線性,大于10則存在嚴重共線性。如果各自變量之間存在嚴重共線性,則可選用嶺回歸或者主成分分析法來處理。
第五,殘差近似正態性。可通過直方圖或者P-P圖判斷殘差是否符合正態分布。
4估計回歸模型參數,建立模型。可根據實際情況,選用強迫引入法、逐步引入法、強迫剔除法、向后剔除法、向前引入法來進行模型估計。
方差不齊時,則需要用加權最小二乘法來進行模型估計。
5對模型進行假設檢驗。對回歸模型進行假設檢驗一般使用方差分析法,對回歸系數進行假設檢驗一般使用t檢驗方法。