一、Python3的安裝
二、請求庫的安裝
1、requests的安裝
直接pip安裝:pip3 install requests
2、Selenium的安裝
selenium是一個自動測試化工具,利用它我們可以驅動瀏覽器執行特定的動作,如點擊、下拉等操作。
直接pip安裝:pip install selenium
3、ChromeDriver的安裝
首先下載Chrome瀏覽器,并記住Chrome的版本號。然后下載ChromDriver,下載完成之后需要進行環境變量的配置,直接將chromedriver.exe復制到python的Scripts目錄下。
當然,可以在命令行下進行驗證:chromedriver。
4、PhantomJS的安裝
百度下載安裝包之后,將其exte文件放在python3的Scripts目錄下,安裝之后進行在命令行下進行測試:phantomjs。
5、aiohttp的安裝
直接進行 pip3 install aiohttp
此外同時推薦安裝兩個庫,一個是字符編碼檢測庫cchardet,另一個是加速DNS的解析庫aiodns。
直接進行 pip3 install cchardet aiodns
三、解析庫的安裝
1、lxml的安裝
直接進行 pip install lxml
lxml是python的一個解析庫,支持HTML和XML的解析,支持XPath的解析方式,而且解析效率非常高。
2、Beautiful Soup的安裝
Beautiful Soup是python的HTML或XML的解析庫,可以用來方便的從網頁上提取數據。注意:Beautiful Soup的HTML和XML的解析器是依賴于lxml庫的。
3、pyquery的安裝
同樣是一個強大的網頁解析工具,它提供了和jQuery類似的語法來解析HTML文檔,支持CSS選擇器,使用非常方便。
直接進行 pip3 install pyquery?
4、tessserocr的安裝
--------------待續。。。