前言
本文是該專欄的第4篇,后面會持續分享python爬蟲案例干貨,記得關注。
在做爬蟲項目的時候,有時候抓取的平臺目標數據為&#x開頭,如下圖所示:
瀏覽器顯示的正常數據,但通過爬蟲協議獲取到的網頁源碼數據卻是以&#x開頭的隱藏數據,遇到這種情況,爬蟲需要怎么處理呢?
針對爬蟲遇到&#x開頭的隱藏數據,一行代碼即可解決,跟著筆者直接往下看正文詳細解決方法。(附帶完整代碼)
正文
地址:aHR0cHM6Ly93d3cuYnRoaG90ZWxzLmNvbS9saXN0L3NoYW5naGFp
目標:解決爬蟲過程中,爬取的目標數據為&#x開頭的數據
1. 問題描述
筆者以上