自相關(Autocorrelation),也稱為序列相關性,指的是同一變量在不同時間或空間點的值之間的關系。簡而言之,自相關就是一個變量與自身在不同位置或時間點的相關性
自相關:針對同一屬性之間進行分析相關性
本質是:一個變量與它自己在不同位置或時間上的值之間的關系。
空間自相關則是針對空間數據,分析其“空間聚集性”或“分散性”
自相關分析:用相同大小的窗口,把數據切分成若干塊,再計算數據間的相關性
把一整片數據(空間上的)分成小塊,一塊一塊地看每塊內部的數據是不是相關的,是不是存在某種聚集或分散的趨勢。這種分析方式就叫做自相關分析,使用的是統一大小的窗口,目的是發現數據在空間上的分布規律
空間自相關
空間自相關描述的是空間單位之間的屬性值是否具有一定的規律性或相似性。它幫助我們判斷空間數據是否聚集、分散或隨機分布
-
正空間自相關:如果相鄰區域的屬性值相似或相同(比如高房價的區域總是聚集在一起),則表現為正空間自相關。
-
負空間自相關:如果相鄰區域的屬性值相差很大(高房價旁邊是低房價),則表現為負空間自相關。
-
無空間自相關:如果屬性值在空間上沒有明顯的聚集或分散,屬于隨機分布。
隨機——相鄰區域同質與異質不確定;
聚集——相鄰區域均同質;
離散——相鄰區域均異質;
在空間上相鄰的區域,它們的值是不是也“相鄰”?——值是否有空間聚集性?
用通俗話講:
高的值是不是和高值靠一起?
低的值是不是也扎堆?
還是高低混在一起沒有規律?
這就叫“空間自相關”。
全局 Moran’s I 指數
衡量空間數據中相似值是否傾向于聚集在一起的程度
是一個 全局統計量(全局指標用于探測整個研究區域的空間模式,使用單一的值來反映該區域的自相關程:度),表示整個區域上的總體空間自相關性強弱
其他表示:
公式理解:
Moran's I 的思路:一個地區 i?的值,和它鄰近地區 j 的值是不是類似。
分子:空間偏差乘積
第 i?個區域的值與平均值的差距(偏差)
兩個區域(i?和 j)的偏差相乘
這個乘積的正負值代表了兩者的相似程度
正值
兩個區域的值都偏高或都偏低 → 相似
負值
一個偏高一個偏低 → 不相似
空間權重矩陣中的元素,表示區域 i 和區域 j?之間的空間關系
所有相鄰區域之間的“趨勢相似性”的加權和
分母:值本身的總離散程度
整個樣本的方差(所有區域的偏差平方和),數據的離散程度
外層乘一個 調整因子:
讓結果的數值范圍大致落在 [-1, 1];
n:樣本點數量
保證不同樣本量、不同鄰接結構下 Moran’s I 有可比性;
Moran’s I 結果解釋
I 值大小 | 空間解釋 |
---|---|
I>0 | 正空間自相關(值相似的區域空間上靠近) |
I=0(約等于) | 無空間自相關(值分布隨機) |
I<0 | 負空間自相關(值相反的區域靠近) |
全局Moran’s I 指數的缺陷
全局莫蘭指數可以判斷某一屬性值在整個研究區域內是否存在自相關性(即屬性值在空間上的分布呈離散、集聚或隨機),但無法判斷是高值集聚還是低值集聚
?
在 ArcMap 中全局 Moran’s I 分析
?在 ArcMap 工具箱中導航:
ArcToolbox > Spatial Statistics Tools > Analyzing Patterns > Moran’s I (Spatial Autocorrelation)
工具參數設置根據需求而定
中間黃色部分為隨機分布,右側為集聚分布,左側為離散分布
標準化指數(Z 分數)
Z 分數越大:說明觀測值離平均值越遠,并且偏向于較高的區域。
Z 分數越小:說明觀測值離平均值越近,或者偏向較低的區域。
Z 分數為負:說明觀測值低于均值
標準化指數(Z-score),表示一個數據點與平均值之間的差距,用標準差來衡量(將不同量綱的數據轉化為無量綱數據,便于比較)
在空間分析中,Z 值通常是通過標準化 Moran’s I 來得到的。
通過計算 Z 值,我們可以判斷 Moran’s I 是否顯著地偏離了零
?
如果 Z 值 > 1.96 或 Z 值 < -1.96(通常使用 95% 的置信區間),那么 Moran’s I 的結果被認為是顯著的,意味著空間數據中存在真實的空間自相關關系。
如果 Z 值接近 0,則說明 Moran’s I 的值可能只是偶然的,不能得出空間自相關的結論
全局空間自相關可以告訴我們某一屬性在整體上是聚集、離散還是隨機,但是無法告訴我們這些現象發生在哪些具體區域
局部空間自相關
局部空間自相關的分析是對全局空間自相關分析的重要補充,主要用于探究空間數據中具體區域的屬性分布情況,定位哪些區域存在顯著的聚集、離散或隨機現象。這種分析有助于揭示空間數據中局部模式,例如高值集聚、低值集聚或異常值
局部 Moran’s I
通過衡量每個空間單元與其鄰近區域之間的相似性來判斷局部空間自相關
-
i?>0:表示區域 i 與其鄰接區域有正向空間自相關,可能是高值聚集或低值聚集。
-
i?<0:表示區域 i 與其鄰接區域有負向空間自相關,形成高-低反轉或低-高反轉模式。
-
i?=0:表示區域 i 的屬性值與鄰接區域沒有顯著的自相關關系,可能是隨機分布
如果局部 Moran’s I 為正且顯著,ArcMap 會根據每個區域的屬性值及其鄰接區域的屬性值,決定是 高值聚集(High-High) 還是 低值聚集(Low-Low)
在 ArcMap 中局部?Moran’s I 分析?
Spatial Statistics Tools > Mapping Clusters > Generate Spatial Weights Matrix
-
Z 值:標準化后的 Z 分數,用于評估局部 Moran’s I 是否顯著。
-
p 值:用于測試 Moran’s I 的顯著性
冷熱點分析
Spatial Statistics Tools > Mapping Clusters > Hot Spot Analysis (Getis-Ord Gi*)
冷熱點分析(Hot Spot Analysis)主要用于確定區域內的“熱點”區域(Hot Spots)和“冷點”區域(Cold Spots),即屬性值較高或較低的區域