學習過程中實驗操作的記錄
1.數據準備和標準化:
(1)區分正負相關性:判斷每個因子是正向指標還是負向指標,計算每個的最大值和最小值
(2) 標準化: Min-Max標準化
Min-Max標準化(最大最小值法): 將數據映射到指定的區間(通常是[0, 1])
標準化值=最大值?最小值/原始值?最小值?
?
用Excel中的函數計算得
對于正向指標,按照每個數據減去最小值,再除以最大值減去最小值進行標準化
?固定的數值加上$
?
?不加$,下拉可能會出現問題
Excel
$
絕對引用的使用規則
完全固定(絕對引用)
$A$1
→ 無論下拉還是右拉,始終引用 A1僅固定列
$A1
→ 拖動時,列 A 不變,行號會隨下拉變化僅固定行
A$1
→ 拖動時,行 1 不變,列號會隨右拉變化
對于負向指標,需要進行反向處理,反向處理值=最大值?原始值
處理后部分數據如下圖:
2.主成分分析/因子分析:
在處理多維度的數據時,主成分分析(PCA)或因子分析(FA)能夠幫助減少數據的維度,將多個相關指標提取為少數幾個綜合性的因子。這些因子可以有效表示社會弱勢性。
主成分分析:通過求解協方差矩陣,提取出主要的成分(因子),這些成分能夠解釋原始數據中大部分的方差。結果會提供每個因子的權重,幫助你理解每個因子對總社會弱勢性的貢獻。
因子分析:與主成分分析類似,因子分析通過提取數據中的潛在因子,減少維度。主要不同在于,因子分析關注于因子背后的結構,而主成分分析主要關注最大化方差
用SPSS軟件對各項原始指標進行數量特征分析
導入數據:
表示數值型變量
進入因子分析界面
點擊 Analyze(分析) → Dimension Reduction(降維) → Factor(因子分析)。
Factor Analysis(因子分析)窗口中,將需要進行主成分分析的數值型變量移動到 Variables(變量) 框內
設置勾選
點擊 OK 運行主成分分析,SPSS 將輸出結果
得到:
?
判斷原始數據是否適合進行因子分析:
KMO(Kaiser-Meyer-Olkin)檢驗是檢驗原始數據是否適合做因子分析的一個指標。KMO值大于0.7通常認為數據適合做因子分析,意味著變量之間有較強的相關性。
KMO值的計算基于變量之間的相關性矩陣和偏相關性矩陣。具體來說,KMO統計量的值是所有變量之間的相關性與偏相關性的比值。
-
KMO值大于0.7:數據適合進行因子分析
Bartlett球形檢驗:Bartlett球形檢驗用于檢驗樣本數據的相關性矩陣是否為單位矩陣
檢驗數據中的各個變量是否存在足夠的相關性,以支持因子分析。單位矩陣的特點是對角線元素為1,非對角線元素為0,表示所有變量之間無相關性
顯著性水平檢驗(Bartlett球形檢驗)用于檢驗原始數據的相關性是否顯著,如果顯著性水平小于或等于0.05,說明數據適合進行因子分析
總方差解釋表,它描述了每個主成分對數據總方差的貢獻情況
前四個主成分的特征值大于1(5.560、2.736、1.379、1.012),因此這四個主成分解釋了數據的大部分方差,總計解釋了82.208%的方差。
第一個主成分主要反映的是教育水平和經濟收入
第二個主成分主要反映的是人口老齡化。
第三個主成分主要與教育水平較低相關
四個主成分主要與居住條件差相關
旋轉后的成分矩陣,我們可以分析每個主成分與原始變量之間的關系
旋轉后的成分矩陣用于使得每個主成分盡可能地與少數幾個原始變量高度相關
每個主成分的特征: 每一列代表一個主成分,每一行代表一個原始變量。每個數值表示原始變量在該主成分上的載荷(即貢獻度)。載荷越大,說明該變量對該主成分的影響越大
每個主成分找>0.7的原始變量
成分得分系數矩陣(Component Score Coefficient Matrix) 是主成分分析(PCA)中的一個重要組成部分,用于描述每個原始變量在主成分中的貢獻。它的作用是在將數據轉換為主成分空間后,幫助我們理解原始變量如何與每個主成分相關
成分得分系數矩陣:可以通過將每個原始變量與相應的主成分得分系數相乘,來計算每個主成分的得分
從中得到前四個主成分載荷>0.7的原始變量
計算每個樣本的主成分得分
為了計算每個樣本的主成分得分,需要將每個樣本的原始數據乘以相應的成分得分系數矩陣。
假設樣本數據為 Xa(每一列是一個樣本),成分得分系數 Ai,那么主成分得分 Z就是:
Z=Xa×Ai
其中 Z?是每個樣本在四個主成分上的得分
可以在Excel上計算
CI=ci與下面這四個系數對應相乘的和,
總的CI值 = 成分1的權重?* c1的值 + 成分2的權重 * c2的值 + 成分3的權重?* c3的值 + ——成分4的權重 * c4的值
在excel上可以完成
為了得到綜合的社會弱勢性評價指數(CI),需要先進行主成分分析或因子分析,目的是將多維的社會經濟指標轉化為少數幾個具有代表性的綜合性因子
?
將這個文件另存為.xls文件
在arcgis里面關聯上
ArcGIS 不支持
.xlsx
格式,確保文件保存為.xls
基于上面操作再用ArcGIS軟件進行空間自相關分析