本期我們來進行實戰,爬取小紅書的相關數據導入到excel中,后續可進行些數據分析,今后或者已經在運營小紅書的小伙伴應該比較喜歡這些數據。今天我們的主角是DrissionPage,相對于之前介紹的selenium省去了很多的配置,直接安裝了就能使用。
DrissionPage 是一個基于 python 的網頁自動化工具。它既能控制瀏覽器,也能收發數據包,還能把兩者合而為一。可兼顧瀏覽器自動化的便利性和 requests 的高效率。它功能強大,內置無數人性化設計和便捷功能。它的語法簡潔而優雅,代碼量少,對新手友好。
使用pip進行安裝
pip install DrissionPage
控制瀏覽器事例
from DrissionPage import ChromiumPage # 創建頁面對象,并啟動或接管瀏覽器 page = ChromiumPage() # 跳轉到登錄頁面 page.get('https://gitee.com/login') # 定位到賬號文本框,獲取文本框元素 ele = page.ele('#user_login') # 輸入對文本框輸入賬號 ele.input('您的賬號') # 定位到密碼文本框并輸入密碼 page.ele('#user_password').input('您的密碼') # 點擊登錄按鈕 page.ele('@value=登 錄').click()
獲取頁面數據事例
from DrissionPage import SessionPage # 創建頁面對象 page = SessionPage() # 爬取3頁 for i in range(1, 4): # 訪問某一頁的網頁 page.get(f'https://gitee.com/explore/all?page