第一章 引言
????????本文基于對框架數據、地名地址數據以及變更調查數據為主體數據源的分析,結合數據融合中分層數據處理原則和內容,從數據管理者、數據應用的角度提出數據質量的定位、需求定位,歸納數據融合過程中存在的困難,提出了數據質檢工具集、數據處理輔助工具集的研發計劃,對提高數據融合的效率和提高數據生產的質量有著重要的意義。
1.1?編寫目的
????????為適應信息化環境下國家政府部門、社會公眾服務對地理信息的迫切需求,滿足數字城市、智慧城市、電子政務、時空信息云平臺等建設對地理信息的需要,規范省級基礎地理框架數據的生產,參照國家及測繪行業等相關標準和規范并結合云南省實際情況,本文檔從矢量數據的質量定位、需求定位出發,描述了數據定位者對數據的預期要求,對云南省框架數據的分層數據、分項內容進行數據問題分析匯總,針對數據融合過程中的困難提出了質檢工具集、數據處理輔助工具集研發計劃,并初步對各圖層內容進行了數據融合要求和規則的整理。
????????方案貫穿矢量數據在融合過程中對數據質量檢查、數據生產輔助工具的需求、有效的數據融合工作流梳理以及工作方案的可行性方面進行了分析說明。旨在研究出系列質檢工具、數據處理工具,完善數據融合工作流,解決在矢量數據生產過程中出現的生產效率低、生產成果質量缺少檢驗手段、實際作業成果與業務需求不相符等問題,對提高數據融合的效率和提高數據生產的質量有著重要的意義。
1.2?預期讀者
????????預期讀者對象包括長期從事數據生產任務、數據處理工具研發、項目管理的項目經理、研發經理、開發人員、測試人員、相關業務人員等。
1.3?術語
-
數據融合:從不同數據源、不同數據精度和不同數據模型的地理空間數據中擇優選取所需要的信息,構建新的地理空間數據集。
-
平面位置精度:地物要素在地理空間數據中的平面位置坐標值與其真實坐標值的吻合程度。
-
幾何表達精細度:地物要素在地理空間數據中表達的詳細程度。
-
同名地物:指在不同來源的地理空間數據中表達的同一個相同地物。
-
屬性規整:指對不同要素的圖層屬性字段進行規范整理。
-
邏輯刪除:指對融合對象的地理實體通過屬性字段作標識刪除。
-
地名點查重:查找實體對象位置和名稱均相同的地名點。
第二章 數據內容
????????從國家基本比例尺框架數據、變更調查數據等中提取、整合、實體化處理的基本的地理空間矢量數據,包括水系、居民地及設施、交通、境界與政區、植被、地名等基礎地理信息數據。該類矢量數據一般經過相對有效的屬性檢查、接邊處理、各級比例尺整合、實體化處理等操作。
????????從商業途徑獲取的導航數據,收集的行業專題數據,以及提交的項目數據,由于數據的資料來源、數據精度、數據結構不盡相同,數據的規范性、現勢性、拓撲關系等存在不一致,分層提取、合并處理時,勢必存在屬性結構規整、圖形幾何處理,要素空間關系處理以及數據接邊等處理。
2.1?數據源分析
????????選擇表達準確、現勢性好、精度高、內容全的要素進行融合更新,最終形成一套現勢性好、精度高、內容豐富的省級核心框架數據。
融合數據源:
? ? (1)1:1萬、1:5萬、1:25萬框架數據;
? ? (2)年度變更調查數據成果;
? ? (3)年度地名地址數據庫成果;
? ? (4)民政部官網最新版本的行政區劃代碼資料;
? ? (5)互聯網獲取的公開的地理信息數據;
? ? (6)收集的行業專題數據或項目數據;
? ? (6)其他專題數據。
????????結合國土變更調查、國情監測影像數據,對比分析數據源中的各分層數據,對現有的框架成果數據庫(本文指1:1萬)進行融合更新。
????????數據分層與命名如下表所示,命名采用五個字符表示,前三個字符代表數據內容,后兩個字符代表數據幾何類型(PL:面;LN:線;PT:點;)。融合更新成果數據必須包括以下內容,但也可根據需要自行擴展數據集。空層保留。
2.2?總體技術流程
????數據融合更新總體技術路線如下圖所示:
在進行數據處理時,總體上按以下處理流程進行:
? ? (1)如果數據源的坐標系統不一致,應首先進行坐標系統轉換,使得數據源可以在統一的空間基準下準確套合。經過坐標系統轉換的數據源在平面位置上仍存在較大誤差時,有必要依據精度較高的數據源對精度較低數據源進行幾何糾正;
? ? (2)要素分層提取:通過對不同數據源中的同類要素進行分析比對,依據現勢性好、幾何表達精確度高、平面位置準、信息內容豐富等原則進行,按圖層、類別提取數據源,盡量減少同名地物的提取;
? ? (3)要素分層合并:對提取出的要素,進行分層合并;
? ? (4)屬性結構規整:進行屬性結構的規范整理;
? ? (5)圖形幾何處理:依據現勢性、要素空間關系等,進行圖形幾何處理;
? ? (6)空間關系處理:處理要素間的空間關系,保證同類要素或不同要素間
空間關系的合理性與邏輯一致性;
? ? (7)數據接邊處理:如融合更新處理分區域或圖幅進行,還應進行不同分區或圖幅間的屬性與幾何接邊處理;
? ? (8)質量檢查:對融合更新后成果數據的質量進行檢查。
第三章 數據現狀分析
3.1?數據質量定位
????????數學基礎:
????????坐標系統:2000國家大地坐標系(CGCS2000)。
????????坐標單位:度。
????????高程基準:1985國家高程基準。
????????單位:米。
????????完整性:
- 數據分類內容完整
????????數據分層、命名與本方案中梳理的要求應一致。數據分類內容,介紹如下:
????????(1)水系:包括河流、溝渠、湖泊、水庫、坑塘、其他水系要素,以及水利及附屬設施等方面的數據。
????????(2)居民地及設施:包括居民地、工礦及其設施、農業及其設施、公共服務及其設施、名勝古跡、宗教設施、科學觀測站、其他建筑物及其設施等。
????????(3)交通:包括鐵路、公路、城市道路、鄉村道路、道路構造物及其附屬設施、水運設施、空運設施、其他交通設施等。
????????(4)境界與政區:包括省級行政區、地級行政區、縣級行政區、鄉級行政區、行政區界線,以及開發區、保稅區、自然與文化保護區、特殊地區界線等。
????????(5)植被:包括種植土地、林草用地等。
????????(6)地名:包括山名、水系名等自然地名,各級行政、居民點、道路等人文地名。
- 分層數據屬性結構合理
????????屬性結構的合理性,體現在屬性結構的設計,應與實際的應用環境和生產環境結合起來分析。屬性項不是越多越好,屬性值的值域的設計也不是越詳盡越好。
????????對每一個圖層的屬性表設計屬性項時,應遵循以下原則:
????????(1)盡可能保留源數據中已有的,且已經賦值的屬性項;
????????(2)屬性項的設計,應與制圖需求,或應用需求相符;
????????(3)?屬性值值域的設計,應合理靈活,具有可拓展性,易操作性;
- 要素采集無大量遺漏
????????應確保作業區域的要素,完整覆蓋,不存在遺漏、丟漏等情況。具體為:
????????(1)融合成果疊加融合數據源,查看是否有要素丟漏情況;
????????(2)收集的融合數據源中,是否作業前就存在要素確實遺漏。
????????表征質量:
-
重復實體去重
????????同一實體數據,不應存在重復表達的要素。如臨近同名興趣點數據,重復道路線數據等。
-
要素及要素間拓撲關系
????????數據接邊檢查,數據幾何質量檢查,要素間邏輯正確性檢查。以確保數據的正確性和準確性。
-
幾何異常
????????極小角、微小要素,多部件要素,面不合理突出、凹陷等。在制圖表達,分析計算中,會引起難以分析的異常結果。
????????屬性精度:
- 屬性值正確性
????????屬性值不應超出值域范圍,也不應存在不合理字符,且屬性值之間往往存在著一定的關聯性,可作為相互驗證的依據。如“×××高速”,其CLASID值應為高速公路代碼。
具體內容有:
????????(1)異常字符:檢查不合理字符(如“空格”、“,”、“?”“!”“換行符”)。
????????(2)合理性檢查:檢查NAME是否全角(包含NAME1、NAME2……等)ENAME、 ROUTENUM字段是否半角(包括ENAME1、ENAME2, ROUTENUM1,ROUTENUM2 …等字段)。
????????(3)必填字段空值檢查:必填字段不允許為空。
????????(4)枚舉值檢查:檢查屬性值是否超出值域范圍。
????????(5)屬性值正確性檢查:檢查屬性值的正確性。
3.2?數據需求定位
????????在做數據庫體設計,數據結構設計時,應對數據使用的需求有清晰的定位。本文從三個數據的使用場景對數據的需求進行分析和定位。
3.2.1制圖需求
????????隨著GIS在各行各業的深入應用,各信息化部門和生產單位在逐漸建立起自己的GIS應用的同時,也積累了大量的地理數據。準確、快速、豐富地將數據建設成果以服務的方式提供使用,保障地理信息公共服務平臺對數據服務和底圖服務的需求,是地理空間平臺信息化的重要內容。
????????電子地圖服務建設,主要包括二維地圖建設,三維地圖建設以及專題地圖建設三類數據地圖成果。通過集成三類數據地圖成果,建設多維地理信息服務平臺,實現大規模多維空間數據的高效管理及數據服務發布,打造統一多維地理信息門戶,為用戶提供全省的基礎地理信息服務能力和提供權威、統一的空間信息多維服務支撐。
- 電子底圖制作
????????二維電子地圖服務建設是在已有基礎測繪等成果基礎上,利用項目獲取的矢量(影像)數據以及互聯網信息等其他數據源,整合建設全省域統一、權威、現勢性強的二維地圖并進行更新,為全省各部門、各行業提供地理信息數據和應用支撐服務。
????????數據服務和底圖服務的準確性和實用性,對數據的現勢性有著較高的要求。通常,從獲取的數據到GIS服務的提供,需要經過數據的幾何質量檢查和屬性的規范性處理,根據制圖需求構造制圖庫,結業業務要求制作地圖模板,發布服務后提供使用。
????????而二維電子地圖制作中通常會用到道路、水系、居民地、興趣點等圖層,這些圖層通常數據量大,數據結構復雜,往往數據幾何質量檢查和屬性規范化處理周期長,想要快速成圖對數據的顯示抽稀和制圖效果增強方面提出了較大的要求。
????????充分利用地名地址數據庫、1:1萬、1:5萬、1:25萬框架數據庫等建設成果,按需補充專題數據,豐富制圖庫數據源,形成制圖數據源成果庫,為制圖庫的生產提供數據支撐。
????????基于制圖庫中的數據分層和屬性結構,對成果數據進行數據質量檢查整改后,分圖層提取數據進行整合,并對提取的數據進行制圖數據規范化處理后,導入制圖庫,形成制圖庫成果。
????????制圖庫必須包括以下內容,但也可根據需要自行擴展數據集,空層保留。
????????電子地圖制圖主要數據圖層如下:
????????更新入庫的成果數據,解決了數據在屬性精度,表征質量和邏輯一致性等方面的質量問題,但把它當作地圖模板的圖層數據源直接用于制圖,仍然存在很多問題,而這一類問題往往在制圖效果上欠佳和在顯示結果上容易出現誤解。
????????如:數據沒有做等級過濾和顯示抽稀,當在小比例尺顯示時,顯示標注的要素數量就會遠遠超過圖面承載量,看到的是雜亂無章的圖面,不僅毫無美感可言,更無法圖出地圖顯示要素的主體,達不到電子地圖應該產生的作用和效果。而就算在大比例尺下,圖面能承載圖層要素后,如不解決數據在顯示效果上的問題,也容易造成誤解,如道路的顯示連通性,當等級道路顯示不連通時,不僅缺乏美觀,也容易讓人認為等級道路是斷開的,不連續的。
????????如此,就需要對成果數據就行分層提取后,進一步做數據的二次加工處理,如新增渲染字段和新增顯示級別字段,提取頂層道路線和水系注記線,對標注的點層數據進行抽稀顯示等操作。
????????對道路,水系,綠地和地理單元等數據進行分層提取后,需要按下表中的處理內容和要求對數據進行二次加工處理。
-
專題圖制作
????????隨著社會經濟的發展和人民生活水平的提高,社會公眾對地理信息的需求日益迫切。通過項目建設進一步豐富數據資源后,納入更多更實用、更多樣的專題信息,更好地為各部門提供輔助決策作用。大力推進在相關專業部門與大型企業的應用,如旅游、教育、人口、交通、醫療、水利、民政、地震、環保、農業、林業等部門開發多個行業應用服務。為政府、行業提供基礎服務,不斷增強平臺的公益性服務能力。
????????專題電子地圖的建設,可通過現有測繪成果資源及相關行業應用資源進行梳理并提取相關專題數據進行整合,依據行業專題符號和特有的內容表達方式,對行業數據符號化渲染和標注,進行圖層服務或地圖服務的發布和共享。對于已經存在的圖層服務和地圖服務,可通過圖層服務的靈活組織,重新創建地圖服務。而利用地圖服務的重組,創建WebMap地圖應用,保存發布。
????????從數據分類的角度,可將行業數據歸納為線狀數據,規劃數據和管理數據。在此分類的基礎上,拓展處二級目錄和三級目錄。針對業務需求,可在每一級目錄列表下提取活組合行業數據,制作專題電子地圖,數據下表。
????????從長期的專題制圖主題匯總分析,將使用頻率較高的專題服務匯總如下表:
3.3.2應用需求
????????通過調研業務部門應用系統對GIS服務,基礎地理信息業務數據的使用情況,分析歸納,按數據實際情況和作業生產情況,對數據內容和屬性結構進行梳理和設計,擴充到融合庫結構中。
- 數據匯總和分發:
????????(1)滿足省市對框架數據融合成果的需求
????????數據的生產、更新,從未間斷。而數據的交互、共享停滯不前。除了數據安全方面的管制原因外,不同職能部門對數據的需求不一致,大家對數據的現勢性、數據的采集精度、數據的模型結構等,要求各不相同。
????????設計生產的成果數據,其結構和內容,應基于通用的國家、行業標準,結合地方實際情況,適應地方規范,使生成的成果數據,能極大的滿足其他生產需求和業務需求。具有一定的通用性。
????????故本文提出的框架數據融合成果,應滿足省、市不同級別的職能部門對框架融合成果的需求。
????????(2)滿足行業部門對分發數據的需求
????????框架成果數據,按行業分層提取的數據,對于行業部門來說,無論數據的豐富性,準確性和現勢性,都處于劣勢。但優勢在于,關聯數據的完整性和省域范圍數據的全覆蓋性。
????????在設計生產過程中,應注重層間要素的拓撲關系和邏輯一致性檢查,注重基礎要素的采集精度,以便在數據分發后,行業部門能更專注于數據屬性的豐富,和數據如何在應用中發揮其價值。
3.3?成果數據分析
????????針對分層數據中常見的問題,舉例說明如下。
3.3.1 地名地址與興趣點
-
分類代碼表
????????地名地址數據更新項目中使用的《POI分類代碼表》,存在分類重復、編碼重復、分類名稱錯誤以及分類設計存在不合理等問題。
????????分類代碼的重復,會給制圖符號化帶來錯誤的表達結果,分類的重復,會讓數據生產的結果存在隨機性,而分類名稱的錯誤,會使得設計的結果準確性遭到質疑。
????????該《POI分類代碼表》中,部分中類下的小類設計過于詳細,但在應用需求和制圖需求中,并不需要如此詳盡的枚舉,這會給后續數據的生產帶來較大的困難和工作量。如保險公司、銀行、餐飲、汽車公司等。
????????從分類設計的合理性、規范性、分類值唯一性等方面綜合分析,此《POI分類代碼表》,在生產和應用中,會帶來較大的困難。
-
簡稱標準制定
????????外業采集或收集到的興趣點點位名稱,一般是點位名稱的全稱,有些公司、單位或機構的名稱字符較長,甚至超過了20個漢字,如:XX 區YY 縣ZZ 鎮人民代表大會常務委員會,在制圖中對于點要素名稱的標注,當名稱長度超過6個字符時,為了地圖美觀和有限的圖幅內能容納更多的標注信息,一般對名稱采取換行標注或采用名稱簡稱的方式進行標注。
????????現有的地名地址數據成果,并未對名稱制作簡稱,項目相關文檔也沒有明確的簡稱標準。
????????名稱字符長度較長實例如下:
????????由于部分興趣點的名稱較長,而又沒有做名稱“簡稱”處理,導致制圖后,相關興趣點的標注內容較多,造成制圖效果不佳。
????????可見,名稱簡稱的制作,是制圖需求對數據的必要內容。參照國家權威部門(國家天地圖)對名稱簡稱的制作標準,如,中國社會科學院,可簡稱為“社科院”;XX 市稅務局 YY 區(縣)分局第一稅務所,可簡稱為“YY 區(縣)第一地稅所”。
-
?重要度劃分
????????地名地址與興趣點的數據生產,“重要度”字段在后續的應用、制圖、數據判重等方面有著重要的作用。它是用來對判定點位重要度的重要因子,直觀且可直接使用。
????????由于興趣點數據通常數據量較大,在空間上容易重疊,為了制圖美觀,用于底圖時需要對其進行顯示抽稀。抽稀顯示的一個重要依據就是興趣點的重要程度,當顯示內容發生沖突時,優先保留重要程度高的點位。描述重要程度,可通過賦值“重要度”字段得以實現。
????????同樣的,在應用中,搜索名稱關鍵詞,實現搜索內容提示或搜索結果TOP10展示時,除了點位名稱與關鍵詞的匹配外,匹配結果在顯示列表中的顯示順序,和點位重要程度,亦有著很大的關系。
????????地名地址數據成果中,對重要度的制作,沒有明確的要求和規范,盡管
-
數據判重
????????在興趣點數據的融合過程中,由于數據來源的繁多,數據質量的參差不齊,表達同一點位實體的要素可能會出現多條記錄的情況。而在一定距離范圍內,同一個名稱的點要素,應當就只有一條記錄。故需要對數據進行重復性檢查處理,確保一定距離范圍內,同一點位實體,不能出現與之名稱完全相同,或名稱及其相似,但表達內容相同的要素。
????????如:“云南民族大學醫院”和“云南民族大學-校醫院”,相距僅6.9米,明顯表達同一實體,但名稱不完全相同,如下圖。
????????點要素數據判重,不同于線要素和面要素,通過幾何拓撲檢查和疊加影像數據,能快速找出存在異常的區域,并且參照影像進行更新。
????????點數據判重,難點在于需要在一定范圍內超出存在表達相同實體的點位,這些點位可能不只是在一個圖層中,它可能存在多個圖層間。
????????但點位判重并處理,對于點位數據的質量,是最基本的要求。它代表了正確性、現勢性和權威性。
????????現有的地名地址數據成果,并未進行層內和層間數據的判處處理。
-
現勢性
????????地名地址與興趣點的更新,在數據現勢性的處理上,幾乎依靠收集的權威資料進行更新,使用影像數據或商業導航數據,都不能較好的做到數據現勢性的準確處理。
????????地名地址與興趣點數據分類眾多,可按不同數據分類的特性和收集數據的難易、權威性進行分類更新。如村級及以上行政地名現勢性,可從國家統計局、民政部等網站上獲取,進行比對更新。政府機構,學校、醫院、小區等數據,可從國情監測成果中提取更新,城區商業性POI數據,可參考商業導航數據。
????????現有的地名地址數據成果,村級及以上的行政地名,存在名稱錯誤和點位錯誤的情況。
????????此外,應在地名地址與興趣點圖層的屬性項中,增加,數據來源、數據現勢性和數據狀態等字段,用于記錄數據的更新情況。
-
?要素關系
????????要素關系,主要是指與其他要素的拓撲關系,如與水系、道路、居民地要素的相對位置。
????????如POI不應該落入水系面中,POI是否落在道路(拓撲容差值3米、內部道路與POI拓撲容差值1.5米),鐵路(拓撲容差值1.5米)上等。
????????興趣點落入水面中:
-
?屬性正確性
????????屬性的正確性,一般包括特殊字符、異常字符檢查,枚舉值檢查,唯一性檢查及正確性檢查等。
????????興趣點分類錯誤:下圖中紅框選中的數據,都是省人民政府單位的區位“門”,但北門被分類為“山莊 別墅小區”。
3.3.2 道路數據
- 圖形正確性
????????道路數據的圖形正確性,主要指檢查道路圖形正確性(懸掛、相交、打折、重線)和檢查相鄰道路路口關系正確性。
????????框架數據中的道路線數據,存在較多的“圖形正確性”問題。
(1)道路數據未連通
????????在道路數據連通性檢查中,發現存在多個地方,道路數據本身物理不連通。
(2)道路線相交
????????下圖左側密集短線,為道路數據存在相互壓蓋的區域,右側為局部放大圖。由下圖可明顯看出,道路存在交叉纏繞的問題較多。這也給道路的顯示連通性調整帶來了較大的工作挑戰。
(3)道路路口相交未打斷
????????十字交叉路口因為捕捉不到位,轉變為兩個丁字路口,或道路能連通行駛,但相交未打斷。
-
要素關系
????????檢查道路圖層與居民地、綠地、水系不合理壓蓋。
????????道路與綠地壓蓋:
????????道路與水系面壓蓋:
????????道路面與居民地壓蓋:
-
屬性值正確性
????????道路屬性值的正確性的檢查,主要包括:
????????(1)等級道路(高速、國道、省道)名稱、編號的正確性和圖形的連通性檢查;
????????(2)CLASID、DISPCLASID、DIRECTION、FORM、FUNCCLASS屬性正確性檢查;
????????(3)道路名稱的合理性檢查;
????????道路線數據中,NAME1字段有值,而NAME字段為空。
????????(4)道路編號合理性檢查;
????????道路線數據中,RN1字段有值,而RN字段為空。
3.3.3?水系數據
(1)水系線
-
圖形正確性
????????水系線的正確性,主要是檢查水系線圖形正確性(懸掛、相交、打折、重線)。
????????干渠與河流隨意打斷:
-
要素關系
????????水系線的要素關系,主要包括:
????????(1)線狀水與面狀水不應共同存在表達同一段水系;
????????檢查水系線與其它圖層壓蓋關系是否合理(水系線與水系面、居民地、綠地不允許存在不合理壓蓋,如線狀水反復出入綠地)。
????????(2)水系線與居民地壓蓋;
????????(3) 水系線與綠地壓蓋;
????????(4)水系線與水系面未連接;
-
屬性值
????????水系線的屬性正確性,主要是檢查:
????????(1)CLASID、LEVEL值域正確性,CLASID和NAME邏輯一致性;
????????(2)檢查LEVEL賦值正確性、合理性;
????????(3)同一水系顯示等級應該一致。
????????干渠CLASID賦值錯誤:
-
流向
????????水系線數據,在融合過程中,需要處理水系的流向,確保水系流向正確。而正確的水系流向,在制作水系河流分級,水系顯示抽稀時,對結果的正確性有著決定性作用。
????????河流起始點高差小于-5的:
(2)水系面
- 圖形正確性
????????水系面圖形正確性,主要是檢查水系面圖形重疊、打折、縫隙等。
????????水系相鄰同名河流面未合并:
-
要素關系
????????水系面的要素關系,主要包括:
????????(1) 水系與綠地、居民地不允許存在不合理壓蓋 ;
????????(2) 水系與綠地疊加時相互做鏤空處理 ;
????????水系面與居民地面不合理壓蓋:
????????水系面與城市綠地面不合理壓蓋:
-
屬性值
????????水系面屬性值主要檢查CLASID、LEVEL值域正確性,CLASID和NAME邏輯一致性。
????????水系面水庫CLASID賦值錯誤:
3.3.4?居民地數據
-
圖形正確性
????????居民地數據圖形正確性,主要包括:
????????(1)檢查居民地面圖形正確性(重疊,打折,縫隙);
????????(2)檢查居民地內部,圖廓線處接邊;
????????(3)解決采集指標不合理、臨近圖斑未融合。
????????圖上一個像素代表的距離 =? 1像素 *? 比例尺=(0.0254/96)*比例尺
????????比例尺與一個像素表示的面積:
????????在對居民地面符號化渲染時,假如居民地輪廓線的寬度為1像素,則最小的上圖圖斑面積應該為9個像素。此判斷依據僅作為制圖上圖標準。
????????此外,1:1萬框架數據中的居民地面,采集粒度不一,較多區域,存在大片勾繪建筑物區域的情況:
-
要素關系
????????居民地面的要素關系,主要包括:
????????(1)是否將居民地層、建筑物層正確合并為一套居民地層;
????????(2) 檢查居民地與其它圖層不合理壓蓋(與水系面、水系線、鐵路圖層不合理壓蓋)。
????????居民地與水系線不合理壓蓋:
????????居民地面與水系面不合理壓蓋:
3.3.4 其他圖層
其余圖層,并未重點分析,但主要的檢查內容包括:
????(1)坐標系統;
????(2)要素遺漏;
????(3)幾何異常;
????(4)要素關系;
????(5)屬性值;
????(6)屬性結構是否合理。
3.4?數據主要問題匯總
????????通過對地名地址與興趣點數據、道路數據、水系數據以及居民地數據的分析,從幾何圖形的正確性,要素間的關系以及屬性正確性等方面對其進行了詳細的介紹和截圖說明。
????????存在的問題歸納為:
? ? (1)圖層部分屬性項設計不合理,甚至存在錯誤,如地名地址與興趣點數據;
????(2)數據的圖形正確性和要素間關系普遍存在質量問題;
????(3) 屬性上,存在較多的賦值錯誤,屬性項間邏輯關系不正確等
????(4)沒有較好的數據融合方案和規劃;
????(5)部分圖層數據的融合,存在較大的隨意性,如居民地數據的采集,居民地面數據與水系面數據的暴力擦除等。
????????從數據分析的情況可以看出,現有框架數據存在較多的質量問題,現有數據,無論用于制圖、應用分析還是數據交互,都存在很多不足。
第四章 數據質檢工具
????????數據質量檢查,是數據成果質量的保障措施,能及時發現作業過程中存在的問題,并對后續的生產作業提出指導建議。
????????數據質量檢查,主要包括數據的幾何圖形檢查、幾何關系檢查以及數據屬性項檢查。
????????本文從質檢內容中選取了部分常見的質檢項,該部分質檢項具有通用性,不局限與特定的數據內容。能制作出通用性的質檢工具箱。
4.1?幾何質檢項
4.1.1 點層要素
????????點層要素的幾何質檢內容,主要是要素的重疊檢查。一般通過使用ArcGIS桌面工具“查找相同項”、“刪除相同項”可以解決,更為復雜的實體去重可以參考“POI實體查重”工具。
4.1.2 線層要素
????????線層要素應解決的幾何問題,包括懸掛點、孤立線、線相交以及重線等幾何質量問題。
4.1.2.1?線懸掛
????????線懸掛示意如下:
????????使用線懸掛拓撲規則,質檢的結果,會將所有的懸掛點標記,但絕大多數的懸掛點是合理的,這會造成在做數據質量檢查時,有很大的工作量是無效的。
????????精準的找出存在需要被處理的懸掛點,是提高懸掛點問題修復的高效措施。
4.1.2.2 孤立線
????????線物理孤立、顯示孤立示意如下:
? ? ? ?物理孤立,可以理解為線幾何要素,其起始點都沒有與其他線段連接。
????????顯示孤立,可以理解為在指定屬性渲染方式下,相鄰的線段,渲染的符號不一致。
4.1.2.3 線相交
????????線相交示意如下:
????????線相交包括線要素間相交和線要素自相交。當交點數量為1時,大多數情況是正確的,線要素間相交表現為連接未打斷,線自相交表現為線打折。
????????因此,做線相交判斷時,不僅需要將線存在相交的地方找出,還因將線的相交類型,線的交點個數一并列出。這將有益于精準找出一定存在質量問題的線相交。
4.1.2.4 線打折
????????線打折示意如下:
4.1.2.5 重線
????????線重線示意如下:?
????????線重線包括線要素間重線和要素重復繪制,要素內重線某種意義上說,類似線打折,此時線打折的夾角為0°或180°。
4.1.2.6 極小角
????????極小角示意圖如下:?
????????線要素的極小角,包括要素內極小角和要素間極小角。
4.1.2.7 微短線
????????微短線示意圖如下:?
????????微短線的存在,會給空間分析帶來不確定異常。尤其是通過節點ID做關聯分析的時候。微短線同時也有可能時孤立線,在對微短線查找時,應同時標識,該微短線的類型。
4.1.2.8 復合要素
????????線復合要素,通常是做裁剪、擦除、融合等操作時產生的。一般通過ArcGIS桌面工具,“多部件至單部件”可以解決。
4.1.2.9 方向
????????線方向,對于道路行駛方向,水系流向、管線方向等,是一個比較重要的幾何質量因子。但在數據處理中,卻是一個工作量較大,且不容易被發現的問題。
????????水系流向方向示意圖如下:?
4.1.3 面層要素
4.1.3.1 面打折
????????面打折示意圖如下:?
4.1.3.2 面縫隙
????????面縫隙示意圖如下:?
????????面縫隙只單個面要素內存在部件的情況,面縫隙與面空洞應能區別開。
4.1.3.3 面重疊
????????面重疊示意圖如下:?
????????面重疊,總是會伴隨面要素間的縫隙。此類縫隙修改較為困難。
4.1.3.4 復合要素
????????除了政區面外,其他要素都不應存在多部件情況。
4.1.3.5 極小角
????????面極小角示意圖如下:?
????????面極小角查找時,應同時查找復合要素的內角夾角。
4.1.3.6 微小面
????????微小面示意圖如下:
?
????????微小面通常時由于分割、擦除、相交、標識等操作造成的。在不考慮層間要素關系時,部分微小面可以通過ArcGIS桌面工具,“消除”來解決。在對微小面查找時,應標識微小面是否是孤立面要素。
4.1.3.7 要素間關系
????????點、線、面要素間關系,更多的是考慮他們質檢的幾何關系和邏輯關系。故未描述點與點之間的關系。
4.1.3.8 點與線
????????點在線上的應用場景,一般是點與線存在空間上的邏輯關系,如地鐵點需要落在地鐵線上。
????????點在線上示意圖如下:?
????????點與臨近線距離計算的應用場景,一般用于判斷POI點與道路線,鐵路線等現狀要素之間的拓撲距離。如POI與道路線的距離應大于3米,與內部道路的距離應大于1.5米。
4.1.4 點與面
????????點落入面中約束了點位與面狀要素的拓撲關系。
????????POI不應落入水面示意圖如下:?
????????點不在面上應用場景相對寬得多,如地鐵出入口應在地鐵面上。一般可通過ArcGIS軟件中的“按位置選擇”實現。
????????地鐵點與地鐵面拓撲關系示意圖如下:?
4.1.5 線與線
????????線與線的要素關系,通常用于判斷頂層道路線與道路線是否重合。
????????頂層線與道路不重合示意圖如下:?
4.1.6 線與面
????????水系線與水系面連通時,需要搭接在一起,不能出現懸掛。
????????水系線與水系面懸掛示意圖如下:?
????????水系結構線、水系注記線應完全落入水系面內。
????????水系線不在水系面內示意圖如下:?
4.1.7 面與面
????????面與面之間的要素關系,面與面部分重疊、完全相同或相互包含的關系都是不允許的,甚至需要相互鏤空(綠地面與水系面)。
????????面重疊示意圖如下:
4.2?屬性質檢項
????????圖層屬性項的之間內容,包括賦值正確性檢查、枚舉值檢查、唯一值檢查等,而通用的檢查內容,一般指非法字符、異常值檢測:
-
英文標點符號檢查;
-
中文標點符號檢查;
-
英文檢查;
-
中文檢查;
-
數字檢查;
-
空格檢查;
第五章 數據處理輔助工具
????????本文梳理的數據處理輔助工具,聚焦于解決數據在質檢過程中發現的錯誤,或數據處理過程中較為常用,又比較方便的工具。
5.1?數據合并
????????當我們接收作業員提交的數據,或作業單位提交的成果數據時,很多情況下,獲取的數據是按區域、按屬性值分割開的數據庫。
????????這些數據內容,需要按圖層名合并成一個完整地理數據庫。但可能存在以下問題:
????????(1)數據格式不一致(mdb、gdb、shp);
????????(2)圖層名稱不相同;
????????(3)同名圖層屬性結構項,字段類型不一致;
????????(4)數據存放在多級目錄結構下等。
????????為此,一個用于將指定目錄下,將不同數據格式,同名圖層名稱的數據合并為一個圖層就顯得尤為重要。
????????該工具在合并過程中,應具有一些其他功能,如對數據進行幾何修復、空值處理、圖層屬性字段自適應等。
5.2?數據分發
????????與數據合并應用場景相反,當需要按指定區域,指定圖層字段屬性值對數據進行分割分發時,數據分發工具將提供一鍵式的解決方法。
5.3?懸掛點檢查修復
????????懸掛點修復工具用于解決,在指定距離查找范圍內,將有可能修復的懸掛點給予修復。這部分懸掛點表現為:
????????(1)懸掛點附近有其他懸掛點,通過連接兩個懸掛點解決懸掛問題;?
????????(2)?懸掛點附近無其他懸掛點,但有臨近線要素;
????????????a) 懸掛點與臨近線要素間,存在一個合適的節點,可連接懸掛點與此節點,解決懸掛問題;? ?
? ??????????b)?懸掛點與臨近線要素間,不存在一個合適的節點,可延長此懸掛點至臨近線合適位置,解決懸掛問題;? ?
??????????合適點:線節點與懸掛點最為接近;懸掛點與該節點連接后,以連接點為中心,與之連接的線之間構成的夾角不小于制定角度(默認30°);且連接后,不能與鄰近線存在立交(跨越)的情況。
??????????c) 懸掛點超出臨近線,可在線相交處截斷線解決懸掛問題;此時不適宜采取移動此懸掛點至臨近線合適的位置來解決懸掛問題,因為伸出的部分可能較長。但伸出的部分的長度超過搜索距離時,對此懸掛點不做任何處理。? ?
5.4?線、面極小角查找
????????極小角的存在,是影響數據使用和表征數據質量不過關的體現,沒有現成的工具用于檢測極小角。
????????通過限定線、面折線間夾角的大小,輸出所有夾角小于該值的位置,有利于快速定位,編輯修改。線、面極小角查找功能,能輔助準確消除極小角質量問題。
5.5?線打折修復
????????線打折,往往伴隨著線要素內出現極小角的情況。
????????極小角的數量,極小角是否連續,解決的方法不同。
5.6?面打折修復字
????????面打折,可能僅存在一個面極小角,也可能是一條面縫隙。
????????面極小角修復結果如下:
5.7?居民地面修復
????????居民地面修復,主要是值對存在不合理凹陷,不合理突出的部分進行修復。它與面打折修復有相似性,他們的區別在于,居民地面要素轉角多為直角或接近直角,修復后的居民地面,仍需要保證這一客觀事實。
5.8?居民地要素簡化
????????居民地要素的簡化,包括兩方面的內容。一是簡化接近平角的直邊上多余的節點,二是按指定距離對臨近范圍內的居民地面進行融合處理,融合后的居民地面需盡量確保融合處的轉角為直角或平角。
????????(1) 移除多余的節點:??
????????(2)?融合指定距離范圍內的居民地面
????????融合過程中,在融合處,保持轉角直角或平角。
5.9?線要素幾何連通性分組
????????對于需要構建網絡的線要要素圖層,一般采取檢查懸掛點,或按距離緩沖線后融合面,用來判斷整個網絡數據是否是一個完整的網絡。兩種檢測方法,檢查懸掛點的方式工作量過大且不能保障正確性。而使用線緩沖融合面的方式,緩沖距離的選擇會導致方法不準確,且數據量大時,不能輸出結果。?
????????線要素幾何連通性分組檢查工具,從線要素節點之間的聯系出發,按節點之間的紐帶關系,找出一張張網絡數據。分組示意圖如下:
5.10?水系線與水系面連接檢測修復
????????水系面與水系線要素間關系,其中之一就是需要確保水系線與水系面之間保持連接。錯誤表現為水系懸掛:?
????????對于此類問題,延長懸掛點至水系面。解決此類問題。
5.11?面縫隙、面重疊處理
????????找出面要素中存在縫隙(非正常孔洞),面要素間存在壓蓋的記錄,提供一鍵式的修復功能,解決面要素中的縫隙問題和面要素間的壓蓋問題。
5.12?地名地址與興趣點獲取
????????地名地址與興趣點數據更新的數據源,有相當一部分數據需要從權威官網,商業導航數據中查詢獲取,用于補充和優化數據的現勢性。
????????使用官網提供的API接口,查詢和獲取地名地址與興趣點的幾何、屬性信息,并整合到地理數據庫中,擴充到更新數據源中。
5.13?屬性值規范化處理
????????屬性值規范化處理工具,提供多場景下的文本字符處理手段。
????????????(1)全角轉半角
????????????(2)半角轉全角
????????????(3)名稱轉拼音
????????????(4)值替換
????????????(5)異常字符剔除
????????????????a) 刪除英文標點符號
????????????????b) 刪除中文標點符號
????????????????c) 刪除英文
????????????????d) 刪除中文
????????????????e) 刪除數字
????????????????f) 刪除空格
5.14?數據接邊
????????分塊數據,合并要素圖層后,在接邊處,存在著同一實體數據被分割,未合并的情況。而由于數據融合中,采集精度的變化,幾何要素的編輯,使得分割處的要素存在偏移。在數據融合過程中,此類情況完全需要人工進行干預。?
????????為了解決數據接邊問題,一個有效的,用于識別接邊位置和要素的工具就顯得尤為重要。
????????接邊數據,可包括線要素和面要素。工具接受搜索距離和接邊分割要素,在指定搜索距離范圍內,對臨近要素進行連接或合并處理(有數據接邊分割線時,僅對分割線附近要素進行分析處理)。
5.15?圖幅號與經緯度的計算
????????為了便于測繪、制作、管理和使用地圖數據,必須按適當的面積將廣大地區的測繪成果數據劃分成適宜的若干部分,并將每個部分進行系統編號。這項工作成為地圖的分幅和編號。
????????分幅可分為兩大類:梯形分幅(又稱“經緯線分幅”)和矩形分幅(包括正方形分幅)。梯形分幅是按經線和緯線來劃分圖幅,左、右以經線為界,上、下以緯線為界,圖形近似梯形。在大范圍的測圖中,考慮地球是一個球面,只有按上述方法分幅才能保證所有圖幅可以緊密結合而又不產生重疊和遺漏。梯形分幅常用于基本比例尺地圖。
????????矩形分幅是按平面直接坐標系的橫縱坐標線來劃分的,圖幅的上、下以坐標橫軸為界,左、右以坐標縱軸為界。對于工程方面需要的局部地區的大比例尺地形圖、平面圖和中小比例尺掛圖和地圖集,常用矩形分幅。
????????而在作業生產過程中,根據圖層數據范圍生成指定基本比例尺下圖幅號,能快速完成對于與歸檔數據的查找、比對及元數據信息的補充。
5.16?劃分線
????????對圖層內的線,以指定距離、多個相等距離、可變距離或總長度的百分比劃分為兩個或多個要素。
5.17?曲線線段修復
????????將線圖層內的曲線線段(貝塞爾、圓弧和橢圓弧)替換為線段。最為常用的方法,就是將要素類轉為shp格式,再將shp導入gdb也可以實現,將曲線段轉為線段,但是兩種格式帶來的數據屬性的改變是不可逆轉的,如字段名,如屬性域等丟失。
5.18?在點處分割線
????????根據交叉點或與點要素的鄰近性分割線要素。ArcGIS Pro提供了“在點處分割線”工具,但是執行效率很低,當數十萬、數百萬條線要素需要在點處分割線事,如道路連接未打斷,將非常有用。
5.19?提取中心線
????????在ArcGISPro中提供了“Polygon To Centerline”工具,而開源的Python包centerline亦提供了對多邊形提取中心線的實現。但他們都存在一些局限,如“Polygon To Centerline”工具需要拓展模塊,僅對“狹長面”處理效果好,而centerline包不能直接處理要素類圖層數據,對分叉數據僅提取最長的中心線等。
還要很多使用的工具需求,再次不再繼續羅列……
第六章 數據融合工作流梳理
6.1?明確的數據融合要求、規則
6.1.1 基本原則
????????數據融合更新時,通過對參與融合的不同精度、不同模型地理數據進行分析比對,從中選取表達準確、現勢性好、精度高、內容全的要素進行融合更新,并對融合后的結果進行幾何拓撲、空間關系與邏輯一致性處理,使融合更新后的地理信息數據在現勢性、準確性、豐富性等方面均得到提升。
????????矢量數據融合更新依據總體原則,按圖層、類別從數據源中擇優選用,依照本地情況考慮全面、簡單化,要素處理時重在集成各項數據源,而不在于編輯。影像數據依據空間覆蓋范圍、影像時相、空間分辨率和影像質量等因素,從數據源中擇優選用。
????????數據融合更新處理的總體原則:
? ? ? ?(1)?數據現勢性:需要融合更新的不同來源的數據現勢性不一致時,以現勢性高的數據為準。
? ? ? ?(2)?屬性取值:不同數據源中同名地物要素的相同屬性項取值不一致時,依據現勢性、準確性等進行一致性處理。
? ? ? ?(3) 空間關系與邏輯一致性:融合更新后的成果數據要素空間關系正確,各類信息邏輯一致。
? ? ? ?(4)?數據內容:融合更新處理時應利用不同數據源的信息進行要素增補,融合后的成果數據應盡可能完整保留數據源中的相關信息。
? ? ? ?(5)?更新增量:更新數據應為有效更新增量,體現地理信息要素的實際變化。重點是保證更新數據的正確性、現勢性。
6.1.2 通用處理要求
????????分層要求:數據分層與命名,命名采用五個字符表示,前三個字符代表數據內容,后兩個字符代表數據幾何類型(PL:面;LN:線;PT:點;下同)。融合更新成果數據必須包括以下內容,但也可根據需要自行擴展數據集。空層保留。
- ?拓撲容差
????????拓撲容差為0.1米。
- 空間位置處理
????????新增或修改的地理信息要素空間位置以上年度框架數據更新成果數據為準。
- 數據現勢性
????????更新信息現勢性達到當年。
- 數據接邊
????????新增和修改要素數據必須進行接邊處理,包括圖形接邊和屬性接邊。圖形接邊時應保證圖形數據光滑、連續,避免出現硬折、尖角;屬性接邊,確保相接同名實體數據屬性信息的一致性。
- 要素空間關系
????????各圖層要素之間無不合理壓蓋,某一類要素更新時如涉及其他圖層,應同時更新相關圖層要素。
- ?圖形正確性
????????線圖層無不合理的懸掛、打折、線相交,無不合理的短線、孤立線。面圖層無不合理的面重疊、面打折、面縫隙,無不合理的極小面。圓、橢圓、手繪線不使用參數曲線,不存在有屬性無圖形的要素對象。
6.2?合理的數據內容和數據結構
6.2.1 便于實施,作業簡單
????????數據融合,是一項連續性、長期性、基礎性的工作,工作內容多、數據內容繁雜、融合效率低,需要特定的部門和專業的技術人員,長期投入。
????????優化設計內容、簡化作業流程、提高融合自動化程度,使數據融合便于實施,作業簡單,從而提高數據融合效率,縮短數據更新周期,提升數據的使用價值。
6.2.2 易于交互、拓展性強
????????設計的圖層內容,屬性結構,充分保留了數據源中的數據信息,又結合制圖、業務應用等,擴增了部分字段,降低了數據的交互困難,增強了數據的拓展性。
6.3?豐富的數據處理輔助工具
????????針對數據不同的使用場景,數據不同作業要求,提供了數據合并、分發,懸掛點修復,線、面打折修復,屬性值規范化等十余種工具。能極大的提高數據融合的效率,提升數據融合的質量。
6.4?有效的數據質檢工具
????????常規的拓撲檢查手段,能解決絕大多數的數據質量問題,但拓撲檢查的結果,也總是無差別的完全輸出,如懸掛點檢查,真正需要修復的懸掛點不到總數的10%。
????????提供的質檢工具,涵蓋了點、線、面要素類型,從幾何到屬性,多種場景,多種角度對數據的質量進行了檢查。數十種質檢工具,能極大的補充常規拓撲檢查無法檢查的質檢項,更細粒度地標識質檢結果,將使得作業人員更加專注于數據的融合更新。
6.5?課題研究
????????數據融合項目中,表現出的數據融合困難,數據處理繁瑣等問題,經過長期的工作總結和積累,應有針對性的提出問題,并設法攻克它。
6.5.1 矢量數據與影像套合基于深度學習的自主評價糾正模型
????????數據矢量化過程,按百度百科的解釋,是指將地理數據由硬拷貝類型或柵格數據類型轉化為矢量數據類型的過程。
?????????本文描述中的矢量化,指利用紙質地圖經過計算機圖形、圖像系統轉化為數字圖像,或航拍獲取的正射影像數據,利用專業的軟件設備,對圖像紋理進行采集,輸出為矢量數據的過程。
????????矢量化獲取的數據,其采集精度,受限于底圖的分辨率和精度。
????????而收集和積累的矢量數據,構成了融合數據源。通過對參與融合的不同精度、不同模型地理數據進行分析比對,從中選取表達準確、現勢性好、精度高、內容全的要素進行融合更新,并對融合后的結果進行幾何拓撲、空間關系與邏輯一致性處理,使融合更新后的地理信息數據在現勢性、準確性、豐富性等方面均得到提升。
????????在數據融合的過程中,有相當大的工作,需要處理是矢量數據的幾何形狀與影像紋理的套合。且套合程度在不同精度的影像底圖上表現不同。為了解決矢量數據與影像的不套合問題,本文提出了“矢量數據與影像套合基于深度學習的自主評價糾正模型”研究課題,該課題旨在利用影像深度學習和大數據分析,識別幾何圖形節點在影像上的正確(推薦)表達位置,基于自主評價系統,對分析的結果進行糾正,完成矢量數據的自主空間矯正。矯正后的數據,需保持原有拓撲結構不變。
6.5.2 多源矢量線成果數據基于深度學習的融合研究
????????矢量線數據的融合,是點、線、面三種要素類型中融合難度、工作量最高的數據類型。
????????線要素不僅數量巨大,要素間關系也非常復雜,它們有著嚴格的表達方式。多源矢量線層數據的融合,更加增加了數據的幾何選取,屬性豐富性表達的難度。
????????線偏移:?
????????不同的道路和名稱:
?????????沿邊界斷開的道路:
????????上述示例中,無論哪一種情況,對于數據融合,都是非常困難的。為了解決此類問題,本文提出了“多源矢量線成果數據基于深度學習的融合研究”課題,旨在利用深度學習,找出數據特征進行匹配,訓練模型,形成自動化融合輔助模型,自動完成幾何數據匹配選取,屬性完善賦值等操作,以減少線數據融合的工作量。
第七章 可行性分析
????????本文從技術可行性、任務階段可操作性及工作量可控性,三個方面對提高數據融合效率和數據成果質量進行可行性分析。
7.1?技術可行性
????????技術可行性,需要考慮技術方案設計合理性,技術路線可行性,項目團隊可靠性等因素。其中,技術方案的設計是基礎,技術路線的測試是核心,項目團隊的實施能力是保障。
7.1.1??成熟的技術解決方案
????????從數據融合內容的選取,分層屬性結構的設計,數據融合要求、規則的確定,以及眾多質檢工具、數據處理輔助工具的支撐,都有著詳細的技術路線和成熟的技術積累。完整的作業流程,成熟的技術解決方案,是本文研究設計的基礎。
7.1.2 基于Geoscene Pro 開發
????????Geoscene Pro有著1400多個地理處理工具,包含了數據管理、空間分析、網絡分析、數據轉換等數十種應用場景下的工具集。并集成了Python開發環境,可以結合行業解決方案和大量的開源包,隨心所欲的開發出解決業務需求的功能和工具。可以說,基于Geoscene Pro開發地理處理工具,是實現本文技術方案的前提。
7.1.3 經驗豐富的項目團隊
????????項目組成員,有著豐富的項目實施經驗,參與了多個省市的天地圖平臺開發、GIS門戶開發、GIS應用設計、課題研究、數據融合、地圖制圖、數據庫運維等作業內容。這期間,項目組成員有了較多的項目實施經驗和大量的技術、工具積累。能很好的完成工作量大、技術難度高、質量要求嚴格的項目建設內容。
6.2?任務階段可操作性
????????任務階段的可操作性,主要是將融合流程中的工作內容,做工作分解,使得分解后的作業步驟和內容,關聯性降低,能齊頭并進,保證作業成果的質量和效率。
- 確定數據融合內容和要求
????????數據融合,忌數據融合內容不確定,融合標準不明確,作業思想不統一。
????????通過確定數據融合的內容、數據結構、融合要求,并貫徹作業要求和標準,能減少數據的重復作業,提高數據的生產質量,提升數據的融合效率。
????????文本梳理設計了數據融合的圖層內容、標準,各分層圖層的屬性結構和字段屬性填寫要求,明確了數據質檢要求并提出了質檢解決方案。在數據融合工作開展前,必須首先完成此項工作內容。
- 數據分層融合
????????基于明確的數據融合內容和要求,可按分層數據融合要求,對分層數據進行融合處理。此階段的核心工作就是解決層內數據質量問題。
????????由于數據融合的圖層數量較多,可優先完善層內數據質量問題,將層間關系留至分層數據處理完成后,再解決要素間關系。如此,可對分層數據同步融合處理,不受層間數據融合的進度制約,能較好的解決作業分發中,融合內容多,融合要求多,層間要素來回編輯等困難,可集中精力,逐一完成分層數據融合。
????????此階段的工作,可根據作業人員的多寡,作業人員技能的熟練程度,鋪開作業。
- 解決要素間關系
????????待分層數據融合完成后,可集中所有數據內容,集中做數據拓撲檢查,數據質量檢查,根據質檢結果,按區域、按圖層間錯誤情況將數據進行二次分發,分區域,分項解決要素間關系。
6.3?工作量可控性
????????有計劃、有針對性地對作業內容,作業范圍進行分析提取,通過研發大量的數據質檢、數據處理工具,用自動化的手段解決大量的重復性和困難的工作,人工做少量的干預和檢查。不僅能提高數據融合的效率,使作業內容能很好的滿足業務需求,還能使工作內容在可控范圍內。
- 數據更新原則
????????在影像數據未發生變化的情況下,優先更新州市中心城區范圍及周邊區域,新建小區、拆遷、工地及新建道路等重要基礎設施及POI點,維護州市范圍內省級以上道路及其他新增重點基礎設施及POI點;其次更新縣級城區范圍及周邊區域,新建小區、拆遷、工地及新建道路等重要基礎設施及POI點,維護縣級范圍內縣道以上道路及其他新增重點基礎設施及POI點;再次更新鄉鎮級城區范圍及周邊區域,新建小區、拆遷、工地及新建道路等重要基礎設施及POI點,維護鄉鎮級范圍內鄉道以上道路及其他新增重點基礎設施、居民地及POI點;在上述區域處理完成后,再逐圖幅進行完善其余區域數據融合。若有影像數據更新,需按上述步驟進行數據融合。隨時關注省級新聞,及時增補、更新省級以上道路、鐵路的通車情況及其他重要地類信息。
- 首要處理重要區域
????????按數據更新的原則,按重要程度,優先次序對作業區域內的數據分區域融合處理。如優先處理中心城區范圍、等級道路、行政區劃、地理單元數據及專題數據等。既能保障業務應用中對核心區域數據現勢性的要求,也能逐步完成全域數據的融合任務。融合過程中,應做好元數據的記錄。
- 有計劃逐步融合、更新數據
????????對全域的數據內容,結合省級自然資源數據中地理空間數據、調查監測數據、國土空間規劃,和省級自然資源與地理空間公共服務平臺建設需求,以及年度預算實施的項目建設內容,對數據進行有計劃,有針對性的融合更新。
- 提高作業的自動化程度
????????盡可能的分析拆解數據融合要求,歸納數據處理問題,用程序的方式替代人工的作業模式,提高作業流程的自動化程度,補充和完善數據編輯,數據質量檢查的工具,解決重復性的操作,提高數據融合效率。
????????看到這里,請受小編一拜,感謝您的閱讀,我真誠地希望這篇文章為您帶來了新的理解和知識,或者在某種程度上啟發了您……