- 引擎向spiders要url
- 引擎把將要爬取的url給調度器
- 調度器會將url生成的請求對象放入到指定的隊列中
- 從隊列中出隊一個請求
- 引擎將請求交給下載器進行處理
- 下載器發送請求獲取互聯網數據
- 下載器將數據返回給引擎
- 引擎將數據再次給到spiders
- spiders通過xpath解析該數據,得到數據或者url
- spiders將數據或者url給到引擎
- 引擎判斷改數據是url,還是數據,是數據的話就交給管道(itempipeline)處理,是url的話就交給調度器處理
本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。 如若轉載,請注明出處:http://www.pswp.cn/news/41240.shtml 繁體地址,請注明出處:http://hk.pswp.cn/news/41240.shtml 英文地址,請注明出處:http://en.pswp.cn/news/41240.shtml
如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!