首先我舉一個案例比如豆瓣電影排行榜 (douban.com)這個電影,首先我們進去檢查源代碼
說明源代碼有,說明是服務器渲染,可以直接那html
但是返回的結果是空,所以我們需要在頭里面加上User-Agent
然后可以看到有返回的結果,如果想拿到其中的名字這時候就要用re正則來進行匹配
然后這是自己寫的正則,可能寫的不夠好
結果爬出來了
如果想拿到這3個信息,如何寫呢
這是我寫的re正則,看結果
如果我們像吧他們存放去了,可以導入csv包只是方便分析而已
結果
首先我舉一個案例比如豆瓣電影排行榜 (douban.com)這個電影,首先我們進去檢查源代碼
說明源代碼有,說明是服務器渲染,可以直接那html
但是返回的結果是空,所以我們需要在頭里面加上User-Agent
然后可以看到有返回的結果,如果想拿到其中的名字這時候就要用re正則來進行匹配
然后這是自己寫的正則,可能寫的不夠好
結果爬出來了
如果想拿到這3個信息,如何寫呢
這是我寫的re正則,看結果
如果我們像吧他們存放去了,可以導入csv包只是方便分析而已
結果
本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。 如若轉載,請注明出處:http://www.pswp.cn/news/719837.shtml 繁體地址,請注明出處:http://hk.pswp.cn/news/719837.shtml 英文地址,請注明出處:http://en.pswp.cn/news/719837.shtml
如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!