前言
本文是該專欄的第81篇,后面會持續分享python爬蟲干貨知識,記得關注。
本文,筆者將詳細介紹一個基于政務網站進行自動采集數據的爬蟲框架。對此感興趣的同學,千萬別錯過。
廢話不多說,具體細節部分以及詳細思路邏輯,跟著筆者直接往下看正文部分。(附帶框架完整代碼)
正文
框架功能:基于政務網站,進行自動采集數據
接下來,筆者直接開門見山。將整個爬蟲框架逐一介紹。
1. 相關依賴庫安裝
在開始之前,首先需要提前安裝好本文要用到的相關依賴庫。如下所示:
requests
lxml
loguru
traceback
python-docx
如果你本地環境,已經安裝上述依賴庫,可以直接跳過該步驟。反之,本地環境未安裝,直接在終端使