文章目錄
- 一、準備工作
- 驅動安裝
- 模塊使用與介紹
- 二、流程解析
- 三、完整代碼
- 四、效果展示
- 關于Python技術儲備
- 一、Python所有方向的學習路線
- 二、Python基礎學習視頻
- 三、精品Python學習書籍
- 四、Python工具包+項目源碼合集
- ①Python工具包
- ②Python實戰案例
- ③Python小游戲源碼
- 五、面試資料
- 六、Python兼職渠道
一、準備工作
驅動安裝
實現案例之前,我們要先安裝一個谷歌驅動,因為我們是使用selenium 操控谷歌驅動,然后操控瀏覽器實現自動操作的,模擬人的行為去操作瀏覽器。
以谷歌瀏覽器為例,打開瀏覽器看下我們自己的版本,然后下載跟自己瀏覽器版本一樣或者最相近的版本,下載后解壓一下,把解壓好的插件放到我們的python環境里面,或者和代碼放到一起也可以。
模塊使用與介紹
selenium
pip install selenium ,直接輸入selenium的話是默認安裝最新的,selenium后面加上版本號就是安裝對應的的版本;csv
內置模塊,不需要安裝,把數據保存到Excel表格用的;time
內置模塊,不需要安裝,時間模塊,主要用于延時等待;
二、流程解析
我們訪問一個網站,要輸入一個網址,所以代碼也是這么寫的。
首先導入模塊
from selenium import webdriver
文件名或者包名不要命名為selenium,會導致無法導入。 webdriver可以認為是瀏覽器的驅動器,要驅動瀏覽器必須用到webdriver,支持多種瀏覽器。
實例化瀏覽器對象 ,我這里用的是谷歌,建議大家用谷歌,方便一點。
driver = webdriver.Chrome()
我們用get訪問一個網址,自動打開網址。
driver.get('https://www.jd.com/')
運行一下
打開網址后,以買口紅為例。
我們首先要通過你想購買的商品關鍵字來搜索得到商品信息,用搜索結果去獲取信息。
那我們也要寫一個輸入,空白處點擊右鍵,選擇檢查。選擇element 元素面板
鼠標點擊左邊的箭頭按鈕,去點擊搜索框,它就會直接定位到搜索標簽。在標簽上點擊右鍵,選擇copy,選擇copy selector 。如果你是xpath ,就copy它的xpath 。然后把我們想要搜索的內容寫出來
driver.find\_element\_by\_css\_selector('#key').send\_keys('口紅')
再運行的時候,它就會自動打開瀏覽器進入目標網址搜索口紅。
同樣的方法,找到搜索按鈕進行點擊。
driver.find\_element\_by\_css\_selector('.button').click()
再運行就會自動點擊搜索了,頁面搜索出來了,那么咱們正常瀏覽網頁是要下拉網頁對吧,咱們讓它自動下拉就好了。 先導入time模塊
import time
執行頁面滾動的操作
def drop\_down():"""執行頁面滾動的操作""" # javascriptfor x in range(1, 12, 2): # for循環下拉次數,取1 3 5 7 9 11, 在你不斷的下拉過程中, 頁面高度也會變的;time.sleep(1)j = x / 9 # 1/9 3/9 5/9 9/9# document.documentElement.scrollTop 指定滾動條的位置# document.documentElement.scrollHeight 獲取瀏覽器頁面的最大高度js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight \* %f' % jdriver.execute\_script(js) # 執行我們JS代碼
循環寫好了,然后調用一下。
drop\_down()
我們再給它來個延時
driver.implicitly\_wait(10)
這是一個隱式等待,等待網頁延時,網不好的話加載很慢。
隱式等待不是必須等十秒,在十秒內你的網絡加載好后,它隨時會加載,十秒后沒加載出來的話才會強行加載。
還有另外一種死等的,你寫的幾秒就等幾秒,相對沒有那么人性化。
time.sleep(10)
加載完數據后我們需要去找商品數據來源
價格/標題/評價/封面/店鋪等等
還是鼠標右鍵點擊檢查,在element ,點擊小箭頭去點擊你想查看的數據。
可以看到都在li標簽里面 獲取所有的 li 標簽內容,還是一樣的,直接copy 。 在左下角就有了 這里表示的是取的第一個,但是我們是要獲取所有的標簽,所以左邊框框里 li 后面的可以刪掉不要。 不要的話,可以看到這里是60個商品數據,一頁是60個。 所以我們把剩下的復制過來, 用lis接收一下 。
lis = driver.find\_elements\_by\_css\_selector('#J\_goodsList ul li')
因為我們是獲取所有的標簽數據,所以比之前多了一個s
打印一下
print(lis)
通過lis返回數據 列表 [] 列表里面的元素 <> 對象
遍歷一下,把所有的元素拿出來。
for li in lis:title = li.find\_element\_by\_css\_selector('.p-name em').text.replace('\\n', '') # 商品標題 獲取標簽文本數據price = li.find\_element\_by\_css\_selector('.p-price strong i').text # 價格commit = li.find\_element\_by\_css\_selector('.p-commit strong a').text # 評論量shop\_name = li.find\_element\_by\_css\_selector('.J\_im\_icon a').text # 店鋪名字href = li.find\_element\_by\_css\_selector('.p-img a').get\_attribute('href') # 商品詳情頁icons = li.find\_elements\_by\_css\_selector('.p-icons i')icon = ','.join(\[i.text for i in icons\]) # 列表推導式 ','.join 以逗號把列表中的元素拼接成一個字符串數據dit = {'商品標題': title,'商品價格': price,'評論量': commit,'店鋪名字': shop\_name,'標簽': icon,'商品詳情頁': href,}csv\_writer.writerow(dit)print(title, price, commit, href, icon, sep=' | ')
搜索功能
key\_world = input('請輸入你想要獲取商品數據: ')
要獲取的數據 ,獲取到后保存CSV
f = open(f'京東{key\_world}商品數據.csv', mode='a', encoding='utf-8', newline='')
csv\_writer = csv.DictWriter(f, fieldnames=\['商品標題','商品價格','評論量','店鋪名字','標簽','商品詳情頁',
\])
csv\_writer.writeheader()
然后再寫一個自動翻頁
for page in range(1, 11):print(f'正在爬取第{page}頁的數據內容')time.sleep(1)drop\_down()get\_shop\_info() # 下載數據driver.find\_element\_by\_css\_selector('.pn-next').click() # 點擊下一頁
三、完整代碼
from selenium import webdriver
import time
import csvdef drop\_down():"""執行頁面滾動的操作""" for x in range(1, 12, 2): time.sleep(1)j = x / 9 # 1/9 3/9 5/9 9/9# document.documentElement.scrollTop 指定滾動條的位置# document.documentElement.scrollHeight 獲取瀏覽器頁面的最大高度js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight \* %f' % jdriver.execute\_script(js) # 執行JS代碼key\_world = input('請輸入你想要獲取商品數據: ')f = open(f'京東{key\_world}商品數據.csv', mode='a', encoding='utf-8', newline='')
csv\_writer = csv.DictWriter(f, fieldnames=\['商品標題','商品價格','評論量','店鋪名字','標簽','商品詳情頁',
\])
csv\_writer.writeheader()# 實例化一個瀏覽器對象driver = webdriver.Chrome()
driver.get('https://www.jd.com/') # 訪問一個網址 打開瀏覽器 打開網址
# 通過css語法在element(元素面板)里面查找 #key 某個標簽數據 輸入一個關鍵詞 口紅
driver.find\_element\_by\_css\_selector('#key').send\_keys(key\_world) # 找到輸入框標簽
driver.find\_element\_by\_css\_selector('.button').click() # 找到搜索按鈕 進行點擊
# time.sleep(10) # 等待
# driver.implicitly\_wait(10) # 隱式等待 def get\_shop\_info():# 第一步 獲取所有的li標簽內容driver.implicitly\_wait(10)lis = driver.find\_elements\_by\_css\_selector('#J\_goodsList ul li') # 獲取多個標簽# 返回數據 列表 \[\] 列表里面的元素 <> 對象# print(len(lis))for li in lis:title = li.find\_element\_by\_css\_selector('.p-name em').text.replace('\\n', '') # 商品標題 獲取標簽文本數據price = li.find\_element\_by\_css\_selector('.p-price strong i').text # 價格commit = li.find\_element\_by\_css\_selector('.p-commit strong a').text # 評論量shop\_name = li.find\_element\_by\_css\_selector('.J\_im\_icon a').text # 店鋪名字href = li.find\_element\_by\_css\_selector('.p-img a').get\_attribute('href') # 商品詳情頁icons = li.find\_elements\_by\_css\_selector('.p-icons i')icon = ','.join(\[i.text for i in icons\]) # 列表推導式 ','.join 以逗號把列表中的元素拼接成一個字符串數據dit = {'商品標題': title,'商品價格': price,'評論量': commit,'店鋪名字': shop\_name,'標簽': icon,'商品詳情頁': href,}csv\_writer.writerow(dit)print(title, price, commit, href, icon, sep=' | ')# print(href)for page in range(1, 11):print(f'正在爬取第{page}頁的數據內容')time.sleep(1)drop\_down()get\_shop\_info() # 下載數據driver.find\_element\_by\_css\_selector('.pn-next').click() # 點擊下一頁driver.quit() # 關閉瀏覽器
四、效果展示
關于Python技術儲備
學好 Python 不論是就業還是做副業賺錢都不錯,但要學會 Python 還是要有一個學習規劃。最后大家分享一份全套的 Python 學習資料,給那些想學習 Python 的小伙伴們一點幫助!
微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費
】

一、Python所有方向的學習路線
Python所有方向的技術點做的整理,形成各個領域的知識點匯總,它的用處就在于,你可以按照上面的知識點去找對應的學習資源,保證自己學得較為全面。
二、Python基礎學習視頻
② 路線對應學習視頻
還有很多適合0基礎入門的學習視頻,有了這些視頻,輕輕松松上手Python~在這里插入圖片描述
③練習題
每節視頻課后,都有對應的練習題哦,可以檢驗學習成果哈哈!
因篇幅有限,僅展示部分資料
三、精品Python學習書籍
當我學到一定基礎,有自己的理解能力的時候,會去閱讀一些前輩整理的書籍或者手寫的筆記資料,這些筆記詳細記載了他們對一些技術點的理解,這些理解是比較獨到,可以學到不一樣的思路。
四、Python工具包+項目源碼合集
①Python工具包
學習Python常用的開發軟件都在這里了!每個都有詳細的安裝教程,保證你可以安裝成功哦!
②Python實戰案例
光學理論是沒用的,要學會跟著一起敲代碼,動手實操,才能將自己的所學運用到實際當中去,這時候可以搞點實戰案例來學習。100+實戰案例源碼等你來拿!
③Python小游戲源碼
如果覺得上面的實戰案例有點枯燥,可以試試自己用Python編寫小游戲,讓你的學習過程中增添一點趣味!
五、面試資料
我們學習Python必然是為了找到高薪的工作,下面這些面試題是來自阿里、騰訊、字節等一線互聯網大廠最新的面試資料,并且有阿里大佬給出了權威的解答,刷完這一套面試資料相信大家都能找到滿意的工作。
六、Python兼職渠道
而且學會Python以后,還可以在各大兼職平臺接單賺錢,各種兼職渠道+兼職注意事項+如何和客戶溝通,我都整理成文檔了。
這份完整版的Python全套學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費
】
