利用爬蟲爬取圖片并保存

1 問題

在工作中，有時會遇到需要相當多的圖片資源，可是如何才能在短時間內獲得大量的圖片資源呢？

2 方法

我們知道，網頁中每一張圖片都是一個連接，所以我們提出利用爬蟲爬取網頁圖片并下載保存下來。

首先通過網絡搜索找到需要的圖片集，將其中圖片鏈接復制然后編入爬蟲代碼，隨后利用open()、iter_content()、write()等函數將圖片下載并保存下來，同時還要確定圖片保存的路徑以便于查找圖片。

找到需要的圖片的網頁鏈接；
利用爬蟲根據網頁爬取圖片；
將圖片下載并保存；

通過實驗、實踐等證明提出的方法是有效的，是能夠解決開頭提出的問題。

代碼清單 1

import requests
def get_pictures(web,path):
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36'}
re=requests.get(web,headers=headers)
print(re.status_code)
with open(path, 'wb') as f:
for chunk in re.iter_content(chunk_size=128):
f.write(chunk)
web='https://static.nowcoder.com/fe/file/oss/1655700469353QRQEI.jpg'
path='數據分析.jpg'
get_pictures(web,path)

3 結語

針對如何短時間內獲取大量圖片的問題，提出使用爬蟲、open()函數、iter_content()函數、write()函數等方法將圖片下載并保存，通過實驗，證明該方法是有效的。其中對于正則表達式的書寫方法還不夠熟練，對于函數open()、iter_content()、write()的使用還存在很多未知，由于知識和技術上存在問題以上代碼只能獲取一張圖片，我們相信通過不斷地學習與練習，我們能進一步優化方法，最終達成目的。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/35132.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/35132.shtml
英文地址，請注明出處：http://en.pswp.cn/news/35132.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！