python代理池好難啊_新人不會自己搭建代理池?快來引用大佬的

新人不會自己搭建代理池?快來引用大佬的

對于新人學習爬蟲來說,雖然不會爬取太難的網站,但是有時候爬取的數據量過大的時候,也會遇到返回不了數據的問題,這時候打開網頁一看.可能會看到"你的ip訪問頻率太高"這樣的提示,出現這種問題的原因可能是,你被封ip啦.

但是爬蟲不是還得繼續不是嗎?這時候就需要借助代理來突破自己ip訪限制或者隱藏自己的ip來防止被封鎖,關于代理則可以搭建代理池來解決,讓網站防不勝防,但是都說了咱是新人!!!怎么會搭建代理池那玩意,這時候就需要像牛頓學習,站在巨人的肩膀上,借用他人的代理池來完成爬蟲.

在這里我們借用了崔大寫的開源代理池代理池地址 ,具體的運行方法崔大已經寫好了,在這里我就想把自己運行這個代理池所遇到的問題做個總結

注:我在這里用的是windows系統.

1 關于代理池的下載前提

下載代理池 首先你需要創建一個github賬號然后安裝git,具體的流程請看git,因為git的安裝在官網下載那簡直是龜速,這里我分享我的網盤鏈接給大家,鏈接:https://pan.baidu.com/s/1gb6mPItCl9OLOAWSlryZMA

提取碼:q1o4

(這個版本不是最新的)

2 關于代理池的下載

安裝好git了我們打開cmd運行命令符,移動到想安裝的盤,然后做出輸入git clone https://github.com/Python3WebSpider/ProxyPool.git ,這樣代理池就下載到本地啦,具體步驟如下圖

3 關于運行所需要的條件

在這里我選擇的是常規方式運行,沒有用到docker,關于常規方式運行,需要滿足以下條件

1.Python>=3.6

2. Redis

3. 安裝依賴包

關于python的下載在這里推薦anaconda下載,安裝最新的anaconda就好啦(雖然后面無法安裝tensorflow,不過我們只爬蟲的嘛),anaconda的安裝教程地址是https://blog.csdn.net/weixin_43715458/article/details/100096496,當然如果你安裝過anaconda或者python請略過這步,但是請確保你的python版本.后面打開代理池我用的是pycharam所以在這里在放一個鏈接關于anaconda安裝與pycharm的配置anaconda與pycharm配置,啥都沒有安裝的請從次鏈接開始.

關于Redis的安裝教程請參考此此鏈接Redis安裝

另外redis常用的可視化工具 Redis Desktop Manager,但是0.9.4以上要給錢的,不過這里有免費的版本,鏈接redis可視化工具下載

關于依賴包的安裝需要在虛擬環境下安裝,這里我使用的是conda創建的虛擬環境,虛擬環境的安裝請參考此鏈接conda安裝虛擬環境,在這里繼續強調你的python版本不能低于3.6,虛擬環境安裝好了 請開啟你的虛擬環境 然后移動到你代理池的文件位置,運行這個命令

pip3 install -r requirements.txt(安裝了anaconda的命令為pip install -r requirements.txt),具體情況如下圖所示

注:這里yu是我的虛擬環境名稱 我已經安裝好了依賴包了 這里做了個演示.

4 關于運行

關于運行其實也沒啥好說的了,打開你的pycharm打開前面下載的代理池文件就好啦,這里對崔大寫的一些做下解釋,

關于這里 其實就在你的setting.py文件里的這里

你可以根據自己的情況進行修改,

關于這里

同樣在setting.py文件里的

你可以根據自己的需要修改測試地址,構建專屬于你所爬網站的代理池.

最后,打開你的 run.py文件點運行就能愉快的開啟代理池啦.

原文鏈接:https://blog.csdn.net/weixin_48257295/article/details/107707037

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/393642.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/393642.shtml
英文地址,請注明出處:http://en.pswp.cn/news/393642.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

pat 1123(AVL)

題意:給n個數,按照順序插入AVL,輸出層次遍歷,如果這顆AVL是完全二叉樹,輸出YES 否則輸出NO 當時考試的時候。忘記AVL什么時候旋轉了,數據結構不會寫,感覺藥丸 判斷完全二叉樹,這個簡…

leetcode435. 無重疊區間(貪心算法)

給定一個區間的集合,找到需要移除區間的最小數量,使剩余區間互不重疊。 注意: 可以認為區間的終點總是大于它的起點。 區間 [1,2] 和 [2,3] 的邊界相互“接觸”,但沒有相互重疊。 示例 1: 輸入: [ [1,2], [2,3], [3,4], [1,3] ] 輸出: 1 …

AMD規范(RequireJS)、CMD規范(SeaJS)、CommonJS(BravoJS)規范的辨析

首先,AMD,CMD,CommonJS都實現了文件模塊化。 對于依賴的模塊:AMD是提前執行;CMD是延遲執行; AMD是依賴前置,CMD是依賴就近; AMD官方解釋:https://github.com/amdjs/amdjs…

客戶旅程_我們進入微服務世界的旅程-以及從中學到的東西。

客戶旅程by Ignacio Salazar Williams通過伊格納西奧薩拉薩爾威廉姆斯(Ignacio Salazar Williams) 我們進入微服務世界的旅程-以及從中學到的東西。 (Our journey into the world of Microservices — and what we learned from it.) I know, I know everyone is talking abou…

英才計劃計算機潛質測評試題,湖北省2020年“英才計劃”潛質測試的通知

12月3日,湖北省青少年科技中心發布湖北省2020年“英才計劃”潛質測試的通知,潛質測試分為筆試和機試兩部分測試時間為2019年12月7日。各相關單位:根據《中國科協辦公廳 教育部辦公廳關于開展2020年“英才計劃”工作的通知》(科協辦發青字〔20…

leetcode1253. 重構 2 行二進制矩陣(貪心算法)

給你一個 2 行 n 列的二進制數組: 矩陣是一個二進制矩陣,這意味著矩陣中的每個元素不是 0 就是 1。 第 0 行的元素之和為 upper。 第 1 行的元素之和為 lower。 第 i 列(從 0 開始編號)的元素之和為 colsum[i],colsum…

Spring Cloud Config服務端配置細節(一)

上篇文章我們看了Spring Cloud中分布式配置中心的一個基本使用,這里邊還涉及到許多細節,本文我們就來看看服務端配置中的一些細節。 本文是Spring Cloud系列的第二十三篇文章,了解前二十二篇文章內容有助于更好的理解本文: 1.使用…

POJ 1797 Heavy Transportation

傳送門&#xff1a;http://poj.org/problem?id1797 不想吐槽了&#xff0c;弄了好久才AC 實現代碼&#xff1a; #include <cstdio> #include <cstring> #include <algorithm> #include <vector> #include <cstdio> #include <iostream> u…

java8中方法區的內存大小如何設置_從Java8升級到Java11

奇技 指南為什么選擇Java11?容器環境支持&#xff0c;GC等領域的增強&#xff0c;僅通過切換到 Java 11 就有 16&#xff05; 的改進。進行了瘦身&#xff0c;更輕量級&#xff0c;安裝包體積小。JDK11 是一個長期支持版。1Java11相對于Java8的一些新特性1.變量類型推斷Var關…

TCP建立連接

TCP的連接建立過程被稱為三次握手:第一次握手&#xff1a;客戶A的TCP向服務器B發出連接請求報文段,其首部中的同步位SYN 1 ,并選擇序號seq x,表明傳送| 數據時的第一 個數據字節的序號是X。第二次握手:B的TCP收到連接請求報文段后,如果同意,則發回確認。ACK1,其確認號ackx1。同…

webgl 著色器_如何使用AI,AR和WebGL著色器來幫助視障人士

webgl 著色器by Dan Ruta通過Dan Ruta 如何使用AI&#xff0c;AR和WebGL著色器來幫助視障人士 (How you can use AI, AR, and WebGL shaders to assist the visually impaired) Today, about 4% of the world’s population is visually impaired. Tasks like simple navigati…

計算機語言乍么設置,電腦如何設置語言

設置語言欄其實語言欄是用來進行輸入法的切換的。當你需要在Windows中進行文字輸入的時候,就需要用語言欄了,因為Windows的默認輸入語言是英文,在這種情況下,你用鍵盤在文本里輸入的文字會是英文字母,所以作為中國人的我們要想在Windows里輸入中文的話,就需要語言欄的幫助了。試…

hive 初認識

結構Hive 是建立在hadoop上的數據倉庫架構,它提供了一系列的工具,可以進行數據提取轉換加載(這個過程叫做ETL),這是一種可以存儲,查詢和分析存儲在hadoop中的大規模數據的機制.Hive定義了簡單的類SQL查詢語句 成為hql,他允許數據SQL的用戶查詢數據.同時 這個語言也允許數據mapr…

git使用(2)

1.遠程倉庫 a SSHKEY 第1步&#xff1a;創建SSH Key。在用戶主目錄下&#xff0c;看看有沒有.ssh目錄&#xff0c;如果有&#xff0c;再看看這個目錄下有沒有id_rsa和id_rsa.pub這兩個文件&#xff0c;如果已經有了&#xff0c;可直接跳到下一步。如果沒有&#xff0c;打開Shel…

郵件中的商務英語

一、常見縮寫 CC carbon copy&#xff1a;抄送 FYI for your information&#xff1a;供你參考 EOD end of the day BTW By the way&#xff1a;順便提一下 COB close of the business 這兩個詞都是指下班前。需要催促某人在下班前給到回復的時候可以用用它們。 eg: Ple…

vue 橫向菜單滾動定位_使用vue組件+iscroll實現一個橫向菜單,不能正確滑動

使用vue組件iscroll實現一個橫向菜單&#xff0c;可是卻不能滑動&#xff0c;給父元素ul寫死一個寬度可以滑動。但是&#xff0c;我在computed里計算寬度&#xff0c;直接路由進去不能滑動&#xff0c;當我進入別的組件(切換路由)回來又可以滑動了示例地址&#xff1a;http://o…

leetcode1353. 最多可以參加的會議數目(貪心算法)

給你一個數組 events&#xff0c;其中 events[i] [startDayi, endDayi] &#xff0c;表示會議 i 開始于 startDayi &#xff0c;結束于 endDayi 。 你可以在滿足 startDayi < d < endDayi 中的任意一天 d 參加會議 i 。注意&#xff0c;一天只能參加一個會議。 請你返…

計算機組成原理實驗讀r1,計算機組成原理實驗一

計算機組成原理實驗一 (5頁)本資源提供全文預覽&#xff0c;點擊全文預覽即可全文預覽,如果喜歡文檔就下載吧&#xff0c;查找使用更方便哦&#xff01;8.90 積分計算機組成原理實驗計算機組成原理實驗第一章、TEC-5 計算機組成實驗箱簡介運算器運算器74181通用寄存器通用寄存器…

如何使用Kotlin構建具有在線狀態的Android Messenger應用

by Neo Ighodaro由新Ighodaro When building a chat application, it is essential to have an online presence feature. It is essential because your users will like to know when their friends are online, and are more likely to respond to their messages in real …

Spark常見問題解決辦法

以下是在學習和使用spark過程中遇到的一些問題&#xff0c;記錄下來。 1、首先來說說spark任務運行完后查錯最常用的一個命令&#xff0c;那就是把任務運行日志down下來。 程序存在錯誤&#xff0c;將日志down下來查看具體原因!down日志命令&#xff1a;yarn logs -application…