廈門大學 鄧明 空間截面回歸模型 地理加權回歸模型 地理加權回歸模型擴展了普通線性回歸模型。在GWR模型中,特定區位的回歸系數不再是利用全部信息獲得的假定常數,而是利用鄰近觀測值的子樣本數據信息進行局域(Local)回歸估計而得,并隨著空間上局域地理位置變化而變化的變數,GWR模型可以表示為: 系數βj的下標j表示與m×1觀測值聯系的待估計參數向量,是關于地理位置(ui,vj)的k+1元函數。GWR可以對每個觀測值估計出k個參數向量的估計值,ε是第i個區域的隨機誤差,滿足零均值、同方差、相互獨立等球形擾動假定。 廈門大學 鄧明 空間截面回歸模型 地理加權回歸模型 GWR模型可以表示為在每個區域都有一個對應的估計函數,其對數似然函數可以表示為: 式中,α為常數, 。由于極大似然法(ML)的解不是唯一的,Hastie and Tibshirani(1993)認為用該方法求解是不恰當的。Tibshirani and Hastie(1987)提出了局域求解法(其原理參見該文獻) 廈門大學 鄧明 空間截面回歸模型 空間回歸模型中的參數解釋 由于空間回歸模型研究的是空間個體間復雜的空間依賴關系,因此,模型的參數包含了關于空間個體間關系的大量信息。某個空間個體相關聯的解釋變量的變化將會影響該空間個體自身,這種影響就是傳統的回歸模型所描述的直接效應(direct effect),同時,也會間接影響其他空間個體,產生間接效應(indirect effect)。正如Behrens and Thisse(2007)所言,分析這種間接效應的能力是空間回歸模型作用的一個重要體現。但是,空間回歸模型的參數所包含的信息也增加了對估計結果進行解釋的難度。 廈門大學 鄧明 空間截面回歸模型 空間回歸模型中的參數解釋 在普通的線性回歸模型中,回歸參數的實際意義非常直觀,只需要將被解釋變量對解釋變量求偏導即可,這一點可由線性回歸模型的線性性以及解釋變量之間的獨立性所保證,對于如下的線性回歸模型: 那么有 成立。也就是說,在普通的線性回歸模型中,個體i的信息集只包含與個體i相關的解釋變量信息。 廈門大學 鄧明 空間截面回歸模型 空間回歸模型中的參數解釋 在包含被解釋變量或是解釋變量的空間滯后項的空間回歸模型中,個體的信息集中除了與個體相關的解釋變量信息外,還包含相鄰地區(觀測個體)的信息,因此對回歸參數的解釋就變得復雜得多,例如如下的Spatial Dubin Model(SDM): 將其改寫成如下的形式: 其中 廈門大學 鄧明 空間截面回歸模型 空間回歸模型中的參數解釋 因此有 其中 表示 中的第i,j個元素, 表示中的第i行。因此由上式可得 這是由于矩陣的存在所導致的。同時 ,這是因為存在一種“反饋環(feedback loops)”效應,地區i的變化將影響地區j,而地區j又反過來會影響i。根據上面的分析可以看出,矩陣 上主對角線上的元素反應的是地區i的解釋變量的變化對地區i的被解釋變量變化的直接效應,而非主對角線上的元素則體現了其他地區的解釋變量的變化對地區i的被解釋變量變化的間接效應。 廈門大學 鄧明 空間面板數據模型 為何要使用空間面板數據模型? “面板數據領域已擴散到幾乎所有計量經濟學角落”。 ——Arrelano(2003),“Panel Data Econometrics”的序言 Hsiao(1986)和Baltgi(2001)認為面板數據具有多方面的優勢: (1)可獲得更多的樣本觀測數據,模型具有更高的自由度。 (2)有效緩解解釋變量之間共線性和觀測個體之間的變異性問題。截面數據中往往存在個體之間的差異明顯,時序自回歸模型中又往往存在著不同程度的共線性問題。解決前者可通過加權的方式,但加權因子的選擇同樣也成為一個問題;解決后者可能需要依賴于一些約束,諸如在分布滯后模型估計中,Almon的多元滯后模型、Koyck的幾何分布滯后模型等。 (3)面板數據綜合考慮了觀測個體之間的差異和個體內部的動態,提供了研究和控制存在于變量之間的不可觀測效應,或遺失變量或不可觀測變量的效應(Hausman and Taylor, 1981) 。 廈門大學 鄧明 空間面板數據模型 為何要使用空間面板數據模型? 利用面板數據可以在一定程度上緩解或解決截面數據使用中碰到的一些