1 問題
在工作中,有時會遇到需要相當多的圖片資源,可是如何才能在短時間內獲得大量的圖片資源呢?
2 方法
我們知道,網頁中每一張圖片都是一個連接,所以我們提出利用爬蟲爬取網頁圖片并下載保存下來。
首先通過網絡搜索找到需要的圖片集,將其中圖片鏈接復制然后編入爬蟲代碼,隨后利用open()、iter_content()、write()等函數將圖片下載并保存下來,同時還要確定圖片保存的路徑以便于查找圖片。
- 找到需要的圖片的網頁鏈接;
- 利用爬蟲根據網頁爬取圖片;
- 將圖片下載并保存;
通過實驗、實踐等證明提出的方法是有效的,是能夠解決開頭提出的問題。
代碼清單 1
import requests def get_pictures(web,path): headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36'} re=requests.get(web,headers=headers) print(re.status_code) with open(path, 'wb') as f: for chunk in re.iter_content(chunk_size=128): f.write(chunk) web='https://static.nowcoder.com/fe/file/oss/1655700469353QRQEI.jpg' path='數據分析.jpg' get_pictures(web,path) |
3 結語
針對如何短時間內獲取大量圖片的問題,提出使用爬蟲、open()函數、iter_content()函數、write()函數等方法將圖片下載并保存,通過實驗,證明該方法是有效的。其中對于正則表達式的書寫方法還不夠熟練,對于函數open()、iter_content()、write()的使用還存在很多未知,由于知識和技術上存在問題以上代碼只能獲取一張圖片,我們相信通過不斷地學習與練習,我們能進一步優化方法,最終達成目的。