一、數據獲取與預處理
-
數據來源選擇
全國A級景區數據可從各省文化和旅游廳官網、國家文化和旅游部網站或第三方GIS數據平臺獲取。推薦使用2020-2021年更新的矢量數據(shp格式)或Excel表格,其中包含景區名稱、地址、等級及WGS84經緯度信息。例如:- 數據字段示例:景區名稱、地址、等級、經度(Lon)、緯度(Lat)。
- 格式要求:優先選擇包含空間坐標的shp文件(點數據)或標準化CSV文件。
-
數據清洗與校驗
- 去重處理:通過Excel的"刪除重復項"或QGIS的"刪除重復幾何"工具,消除同一景區的重復記錄。
- 缺失值處理:若經緯度字段缺失,可結合景區地址通過地理編碼插件(如MMQGIS)補全坐標。
- 異常值檢測:篩選經度范圍(73°E-135°E)、緯度范圍(3°N-54°N)外的異常坐標,并人工核查修正。
-
格式統一化
- 將Excel數據轉換為UTF-8編碼的CSV文件,避免中文亂碼。
- 若使用分省數據(如各省單獨shp文件),需通過QGIS的"合并矢量圖層"工具整合為全國數據集。
二、QGIS數據導入與坐標驗證
-
導入矢量數據(shp格式)
- 操作路徑:
圖層 → 添加圖層 → 添加矢量圖層
。 - 坐標系設置:選擇WGS84(EPSG:4326)。
- 屬性表檢查:右鍵圖層選擇"打開屬性表",確認經度(X)、緯度(Y)字段存在且數值合理。
- 操作路徑:
-
導入CSV文本數據
- 操作路徑:
圖層 → 數據源管理器 → 分隔文本
。 - 參數設置:
- 操作路徑:
- 文件格式:CSV,編碼選GBK或UTF-8。
- X字段:經度(Longitude);Y字段:緯度(Latitude)。
- 坐標系:強制指定為WGS84(EPSG:4326)。
- 示例代碼(用于檢測導入異常):
SELECT * FROM 景區表 WHERE Lon NOT BETWEEN 73 AND 135 OR Lat NOT BETWEEN 3 AND 54;
- 示例代碼(用于檢測導入異常):
- 可視化驗證
- 疊加底圖:通過
XYZ Tiles
加載OpenStreetMap或高德地圖,觀察景區點位是否與真實位置匹配。 - 空間分布分析:使用QGIS的"點密度分析"工具,檢測是否存在坐標聚集異常(如大量景區集中在同一經緯度)。
- 疊加底圖:通過
三、坐標提取與導出
-
直接導出屬性表
- 操作路徑:右鍵圖層 →?
導出 → 保存要素為
。 - 格式選擇:CSV、Excel或GeoJSON,保留"經度"、"緯度"字段。
- 編碼設置:導出CSV時選擇UTF-8,避免中文亂碼。
- 操作路徑:右鍵圖層 →?
-
腳本批量處理(Python示例)
使用QGIS內置Python控制臺批量導出多省份數據:import processing layers = QgsProject.instance().mapLayers().values() for layer in layers:if layer.name().startswith("A級景區"):output_path = f"C:/output/{layer.name()}.csv"processing.run("qgis:exportaddstabletolayer", {'INPUT': layer,'OUTPUT': output_path})
運行
-
高級導出需求
- KML格式:適用于Google Earth可視化,導出時選擇
Keyhole Markup Language (KML)
。 - GeoPackage:適用于多圖層集成存儲,通過
導出 → GeoPackage
實現。
- KML格式:適用于Google Earth可視化,導出時選擇
四、數據質量提升技術
- 地理編碼補全缺失坐標
- 安裝MMQGIS插件:
插件 → 管理插件 → 搜索MMQGIS
。 - 批量補全地址坐標:
- 安裝MMQGIS插件:
- 輸入文件:包含"地址"字段的CSV。
- 服務選擇:高德地圖API(需申請密鑰)或OpenStreetMap。
- 輸出字段:自動生成"經度"、"緯度"列。
-
坐標糾偏技術
若原始數據使用GCJ-02或BD-09坐標系,需通過HCMGIS
插件轉換為WGS84:- 操作路徑:
HCMGIS → 工具 → 坐標系轉換
。 - 參數設置:輸入坐標系選GCJ-02,輸出選WGS84。
- 操作路徑:
-
異常值修正方法
- 人工修正:通過
Lat Lon Tools
插件點擊地圖獲取準確坐標。 - 交叉驗證:對比國家地理信息公共服務平臺(天地圖)的POI數據。
- 人工修正:通過
五、可視化與成果應用
-
熱力圖分析
使用QGIS的"熱力圖渲染"功能,分析景區分布密度:- 半徑設置:50公里(全國尺度)。
- 配色方案:從藍色(低密度)到紅色(高密度)。
-
ECharts動態可視化
導出CSV數據后,通過ECharts生成交互式地圖:option = {series: [{type: 'scatter',coordinateSystem: 'geo',[[116.40, 39.90, '故宮'],[120.15, 30.25, '西湖'],// ...其他景區數據],symbolSize: 8,label: { show: true }}] };
運行
-
空間分析擴展
- 緩沖區分析:計算5A級景區周邊10公里內的交通設施覆蓋率。
- 可達性評估:通過
Service Area
工具分析高鐵站到景區的通行時間。
六、注意事項與常見問題
-
坐標系一致性
- 確保所有數據統一為WGS84(EPSG:4326),避免混合使用GCJ-02或CGCS2000。
- 投影轉換工具:
處理工具箱 → 矢量通用 → 重投影圖層
。
-
性能優化
- 大數據處理:對全國1.2萬+景區數據啟用空間索引(
圖層屬性 → 源 → 創建空間索引
)。 - 分省處理:通過
按屬性分割
工具分批次導出,減少內存占用。
- 大數據處理:對全國1.2萬+景區數據啟用空間索引(
-
法律與數據倫理
- 遵守《地理信息安全保密規定》,不得公開軍事禁區、自然保護區等敏感區域坐標。
- 引用數據需注明來源(如"數據來源于各省文化和旅游廳,2020年")。