NeighborGeo:基于neighbors的IP地理定位
X. Wang, D. Zhao, X. Liu, Z. Zhang, T. Zhao, NeighborGeo: IP geolocation based on neighbors, Comput. Netw. 257 (2025) 110896,
Abstract
IP地址定位在網絡安全、電子商務、社交媒體等領域至關重要。當前主流的圖神經網絡方法通過將IP定位任務重構為屬性圖中的節點回歸問題,利用特征對節點之間的連通性進行建模,提高了定位精度。然而,在實際應用中,路標往往是分散的、不規則的,并且容易受到異常值的影響,這使得路標選擇和關系學習的不可靠性限制了它們的準確性。為了應對這些挑戰,提出了一種基于圖結構學習的IP地址定位模型NeighborGeo。該模型采用重參數化和有監督對比學習來精確捕捉和選擇性地加強節點之間的特定鄰居關系,以優化結構表示。通過準確地捕獲和利用鄰居,該模型實現了準確的預測。實驗結果表明,在紐約、洛杉磯和上海的開源數據集上,NeighborGeo的定位精度明顯高于現有方法,特別是在地標分布不均勻的場景下。
1. Introduction
IP地理定位是利用Internet協議(IP)地址確定設備或用戶所在位置的過程。該技術被廣泛應用于許多不同的領域,如網絡安全、定向廣告和社交媒體等。在網絡安全中,它有助于識別攻擊源的精確地理位置,使檢測和預防[3]web攻擊成為可能。在定向廣告中,廣告商利用IP地理定位來確定用戶的位置,從而可以投放更有針對性的廣告,從而提高轉化率和投資回報率[4]。而在社交媒體中,平臺利用IP地理定位提供地圖繪制、位置共享等服務,提高了用戶交互[5]。在當今互聯網服務中,研究先進的IP定位技術對優化網絡服務、加強網絡安全具有重要意義。它對商業和安全等行業也具有重大的現實意義[2-5]。
隨著地理定位技術的發展,用戶可以依靠GPS定位、基站定位和Wi-Fi定位等技術以極高的精度跟蹤自己的位置。這種方法通常被稱為客戶端依賴的IP定位[6-8]。然而,隨著用戶隱私保護和安全意識的增強,GPS和Wi-Fi模塊的授權變得越來越困難。此外,在一些沒有額外輔助模塊[9]的網絡設備上,依賴于客戶機的IP定位并不那么成功。因此,與客戶端無關的IP定位技術(僅需要IP地址信息)因其明顯的優勢而被廣泛研究。一般來說,IP geolocation更多的是指與客戶端無關的IP geolocation[2,10]。客戶端無關的IP定位方法分為基于數據的方法、基于測量的方法和基于學習的方法[2]。基于數據的方法依賴于從互聯網上收集的相關數據,包括ISP數據、WHOIS信息和webcam數據[9,11]。這些方法操作方便,但其準確性受到更新頻率和覆蓋范圍的限制。基于測量的方法通過運行ping和traceroute[12]等網絡測量任務來收集延遲和路由路徑的信息。雖然該方法能夠適應網絡動態變化,但其有效性受到可用網絡資源和網絡狀態的限制。與此同時,基于學習的方法,包括機器學習和深度學習技術,如圖神經網絡 (GNNs),已成為推動該領域精度提高的前沿技術[13,14]。
在基于學習的IP定位方法中,基于圖神經網絡的IP定位以其更高的定位粒度和精度而脫穎而出。該方法構建包含網絡節點的圖模型,分析節點本身及其拓撲連接和相互作用的屬性。通過探索特征和地理位置之間的深度聯系,基于GNN的方法成為IP地理定位領域最流行的方法[5,15,16]。盡管基于圖神經網絡的IP定位方法具有顯著的理論優勢,因為它們可以利用周圍的地標進行預測,但準確識別正確的“鄰居”仍然是一項具有挑戰性的任務。當路標分布均勻密集時,鄰居選擇變得更加直接,目標和路標之間的關系更加清晰,從而減少鄰居選擇中的不可靠關系和誤差,最終提高定位精度。然而,在實際應用中,landmark往往是分散的、不規則的,并且包含異常值。現有的定位方法在預測過程中經常受到較遠的地標的影響,導致在學習過程中對不相鄰的地標賦予過多的重要性,顯著降低了定位精度。
針對這一現象,分析其具體原因并總結如下:
(1)不可靠的目標-地標關系(Unreliable target-landmark relationships):