文章目錄
- 一、selenium安裝
- 1. Python環境準備:
- 2. 安裝Selenium:
- 3. 瀏覽器驅動安裝:
- 4. 驗證安裝:
- 二、常見問題
- 1. Selenium版本與瀏覽器驅動程序不兼容:
- 2. 瀏覽器驅動程序路徑未正確設置:
Selenium是一個用于Web應用程序測試的自動化工具。它直接運行在瀏覽器中,模擬真實用戶的操作。Selenium支持多種主流瀏覽器,如IE、Mozilla Firefox、Safari、Google Chrome、Opera和Edge等。在爬取數據的時候對于需要登錄后才能爬取的情況往往可以利用Selenium來進行模擬登錄,登錄后進行數據的獲取。這里先介紹Selenium的安裝與配置,實現通過python來驅動瀏覽器進行操作。
一、selenium安裝
要安裝Selenium,首先需要具備Python開發環境。以下是安裝Selenium的步驟:
1. Python環境準備:
-
打開Python官網:https://www.python.org/downloads/,下載適合你操作系統的Python版本。
-
安裝Python。在window下安裝python環境非常簡單,直接下一步下一步就可以安裝完成。安裝過程中,確保將Python添加到環境變量中,以便在命令行中運行Python命令。
-
安裝完成后,可以在命令行中輸入
python --version
來驗證Python是否安裝成功,并查看版本號。
2. 安裝Selenium:
- 在命令行中,使用pip(Python的包管理工具)來安裝Selenium。輸入以下命令并按回車鍵執行:
- 如果你的系統有多個Python版本,可能需要使用pip3代替pip。
pip install selenium
3. 瀏覽器驅動安裝:
- Selenium支持多種瀏覽器,但每種瀏覽器都需要相應的驅動程序。例如,對于Chrome瀏覽器,你需要下載ChromeDriver。
○ 訪問ChromeDriver的下載頁面:https://sites.google.com/a/chromium.org/chromedriver/,選擇與你的Chrome瀏覽器版本相對應的ChromeDriver版本。
○ 國內鏡像下載站點 https://registry.npmmirror.com/binary.html?path=chromedriver/
高版本的ChromeDriver可以在https://chromedriver.com/download 下載 - 下載后,解壓(如果需要的話),并將ChromeDriver的路徑添加到系統環境變量中,或者將其放在你的項目目錄中。比如我的是放到 C:\python\Scripts 并將C:\python\Scripts配置到了系統環境變量中。
4. 驗證安裝:
參考selenium的官方文檔,創建一個簡單的Python腳本,使用Selenium打開瀏覽器并訪問一個網頁。
運行這個腳本。如果一切順利,它會打開Chrome瀏覽器并導航到指定的URL,然后關閉瀏覽器。
代碼如下:
from selenium import webdriver
from selenium.webdriver.common.by import Bydriver = webdriver.Chrome()driver.get("https://www.selenium.dev/selenium/web/web-form.html")title = driver.titledriver.implicitly_wait(0.5)text_box = driver.find_element(by=By.NAME, value="my-text")
submit_button = driver.find_element(by=By.CSS_SELECTOR, value="button")text_box.send_keys("Selenium")
submit_button.click()message = driver.find_element(by=By.ID, value="message")
text = message.textdriver.quit()
效果如下:
打開一個瀏覽器,訪問https://www.selenium.dev/selenium/web/web-form.html
對瀏覽器中的元素進行操作,最后關閉瀏覽器。
請注意,由于Selenium和瀏覽器驅動程序可能會定期更新,因此在安裝和配置過程中,最好參考最新的官方文檔和指南。
二、常見問題
在安裝Selenium的過程中,可能會遇到一些常見的問題
1. Selenium版本與瀏覽器驅動程序不兼容:
- 問題:安裝的Selenium版本與瀏覽器驅動程序版本不兼容。
- 解決方案:檢查Selenium和瀏覽器驅動程序的版本,確保它們相互兼容。通常,Selenium的最新版本會支持最新的瀏覽器驅動程序。如果需要,可以降級或升級Selenium或瀏覽器驅動程序以確保兼容性。
2. 瀏覽器驅動程序路徑未正確設置:
- 問題:瀏覽器驅動程序的路徑未正確設置,導致Selenium無法找到驅動程序。
- 解決方案:確保將瀏覽器驅動程序的路徑添加到系統環境變量中,或者在Selenium代碼中明確指定驅動程序的路徑。例如,對于ChromeDriver,可以在代碼中這樣設置:
from selenium import webdriver
driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
后續我們將實戰通過selenium來實現登錄到淘寶并獲取淘寶的商品信息。
作者博客:http://xiejava.ishareread.com/