網絡爬蟲--19.【Scrapy-Redis實戰】分布式爬蟲爬取房天下--環境準備

文章目錄

  • 0. 思路
  • 一. 虛擬機Ubuntu0中安裝Redis
  • 二. 虛擬機Ubuntu1中安裝Redis
  • 三. Windows服務器上安裝Redis
  • 四. 安裝cmder
  • 五. 安裝RedisDesktopManager
  • 六. 修改Windows中的配置文件redis.windows.conf
  • 七. Ubuntu連接Windows上 的Redis服務器
  • -------------------------------------------------------------------------
  • 八.Windows上創建虛擬環境并安裝Scrapy
  • 九.Ubuntu上創建虛擬環境并安裝Scrapy

0. 思路

準備三臺服務器,分別是Windows、Ubuntu1、Ubuntu2;

其中Windows服務器作為分布式爬蟲的Redis服務器;

Ubuntu1和Ubuntu2作為分布式爬蟲的爬蟲服務器。

一. 虛擬機Ubuntu0中安裝Redis

安裝:sudo apt-get install redis-server

卸載:sudo apt-get purge --auto-remove redis-server

啟動:sudo service redis-server start

查看:ps aux|grep redis

停止:sudo service redis-server stop

二. 虛擬機Ubuntu1中安裝Redis

同上。

三. Windows服務器上安裝Redis

1.首先安裝Redis,安裝教程:https://www.runoob.com/redis/redis-install.html

2.啟動Redis服務:(切換至Redis安裝目錄中)
redis-server.exe redis.windows.conf

若報錯,按步驟執行以下命令:
redis-cli.exe
shutdown
exit
redis-server.exe redis.windows.conf

3.啟動Redis客戶端
redis-cli.exe

輸入測試數據:
set username fanxindong

get username

在這里插入圖片描述

四. 安裝cmder

安裝教程及配置:https://www.jianshu.com/p/5b7c985240a7

五. 安裝RedisDesktopManager

安裝教程及配置:https://www.jb51.net/softs/669908.html

安裝后連接Redis,查看測試數據。
在這里插入圖片描述

六. 修改Windows中的配置文件redis.windows.conf

打開Windows中Redis的配置文件redis.windows.conf

將bind后的ip地址更改為windows 的ip地址;

這里為了爬蟲服務器連接方便,更改為0.0.0.0

在這里插入圖片描述

七. Ubuntu連接Windows上 的Redis服務器

在Ubuntu服務器輸入以下指令:

redis-cli -h 172.20.20.2 -p 6379

其中172.20.20.2為windows的服務器ip地址。

查看測試數據:
在這里插入圖片描述

-------------------------------------------------------------------------

八.Windows上創建虛擬環境并安裝Scrapy

首先安裝 virtualenv,打開命令行工具,輸入下面的命令即可安裝 virtualenv:

pip install virtualenv

安裝成功后就可以開始創建虛擬環境,指定一個你喜歡的目錄,virtualenv 會把這個新的虛擬環境裝到你指定目錄下。例如我把它裝到 C:\Users\fxd.virtualenvs\ 目錄下,并將虛擬環境命名為 sipder_env(也可以取任何你喜歡的名字)。在命令欄運行如下命令:

virtualenv C:\Users\fxd\.virtualenvs\sipder_env

虛擬環境已經創建好了,我們需要激活這個環境,進入到剛才創建的虛擬環境的根目錄,運行 Scripts 目錄下的 activate 程序激活它:

cd C:\Users\fxd\.virtualenvs\sipder_env
.\Scripts\activate

可以看到命令提示符前面多了 (sipder_env),說明我們已經成功激活了虛擬環境,接下來就可以開始安裝 Scrapy了。

使用豆瓣的鏡像源安裝:

pip install Scrapy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

Scrapy中文文檔:https://scrapy-chs.readthedocs.io/zh_CN/latest/intro/tutorial.html

九.Ubuntu上創建虛擬環境并安裝Scrapy

安裝virtualenv:

pip install virtualenv

創建虛擬環境并自動進進入:

mkvirtualenv -p /usr/bin/python3 spider_env

退出虛擬環境:

deactivate

再次進入虛擬環境的激活指令:

source ./bin/activate

接下來安裝Scrapy,首先安裝依賴:

sudo apt-get install build-essential python3-dev libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev

安裝scrapy:

pip install Scrapy

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/451975.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/451975.shtml
英文地址,請注明出處:http://en.pswp.cn/news/451975.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

開發人員,請愛護你的身體

最近一周身體極度不適,口腔潰瘍、嗓子痛、感冒咳嗽、發燒,統統來了一個遍,非常痛苦。所以最近一直關注有關于軟件開發人員的身體健康問題的網站、文章。 看了許多文章,在結合自己在這一周之內痛苦的感受,所以才寫這樣…

tkinter中scale拖拉改變值控件(十一)

scale拖拉改變值控件 使用戶通過拖拽改變值 簡單的實現: 1 import tkinter2 3 wuya tkinter.Tk() 4 wuya.title("wuya") 5 wuya.geometry("300x2001020") 6 7 8 # 創建對象 9 scale1 tkinter.Scale(wuya, from_0, to100) 10 scale1.pac…

vue+elementUI開發實踐問題總結

最近公司項目采用vue,實行前后端分離開發,采用element-ui框架,對于項目中遇到的問題進行記錄,便于日后查詢。 vueelementui怎樣點擊table中的單元格觸發事件?官方文檔是采用的cell-click方式。實際項目中需要在不同的t…

Socket的getInputStream()方法

Socket的getInputStream()方法可以獲得網絡連接輸入,同時返回一個InputStream實例 。

計算機圖形學理論(4):緩沖區

本系列根據國外一個圖形小哥的講解為本,整合互聯網的一些資料,結合自己的一些理解。 什么是緩沖區? 緩沖區是保存某些數據的臨時存儲空間。 為什么我們需要緩沖區?原因很簡單,當數據量很大時,因為計算機無…

解決:Every derived table must have its own alias

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到教程。 報錯: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Every derived table must have its own alias 解決&…

網絡爬蟲--20.【Scrapy-Redis實戰】分布式爬蟲獲取房天下--代碼實現

文章目錄一. 案例介紹二.創建項目三. settings.py配置四. 詳細代碼五. 部署1. windows環境下生成requirements.txt文件2. xshell連接ubuntu服務器并安裝依賴環境3. 修改部分代碼4. 上傳代碼至服務器并運行一. 案例介紹 爬取房天下(https://www1.fang.com/&#xff…

同一臺電腦安裝python2python3

【安裝之前,先了解一下概念】 python是什么? Python是一種面向對象的解釋型計算機程序設計語言,由荷蘭人Guido van Rossum于1989年發明,第一個公開發行版發行于1991年。 Python是純粹的自由軟件, 源代碼和解釋器CPytho…

程序員的常見健康問題

其實這些問題不僅見于程序員,其他長期經常坐在電腦前的職場人士(比如:網絡編輯、站長等),都會有其中的某些健康問題。希望從事這些行業的朋友,對自己的健康問題,予以重視。以下是全文。 我最近…

Java中BufferedReader和InputStreamReader

BufferedReader 類BufferedReader 由Reader類擴展而來,提供通用的緩沖方式文本讀取,而且提供了很實用的readLine,讀取一個文本行,從字符輸入流中讀取文本,緩沖各個字符,從而提供字符、數組和行的高效讀取。…

網絡爬蟲--21.Scrapy知識點總結

文章目錄一. Scrapy簡介二. Scrapy架構圖三. Scrapy框架模塊功能四. 安裝和文檔五. 創建項目六. 創建爬蟲一. Scrapy簡介 二. Scrapy架構圖 三. Scrapy框架模塊功能 四. 安裝和文檔 中文文檔:https://scrapy-chs.readthedocs.io/zh_CN/latest/intro/tutorial.html …

Spring 定時任務的幾種實現

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到教程。 近日項目開發中需要執行一些定時任務,比如需要在每天凌晨時候,分析一次前一天的日志信息,借此機會整…

trie樹(字典樹)

trie樹學習 學習trie樹 轉載于:https://www.cnblogs.com/cjoierljl/p/9317023.html

Vue 教程第四篇—— Vue 實例化時基本屬性

實例元素 el 實例元素指的是 Vue 實例化時編譯的容器元素&#xff0c;或者說是 Vue 作用的元素容器 <div id"app"></div> var vm new Vue({el: #app}) 也可以為實例元素指定其它選擇器 <div class"app"></div> var vm new Vue({…

Ubuntu將在明年推出平板及手機系統

4月26日下午消息&#xff0c;知名Linux廠商Canonical今天正式發布Ubuntu 12.04版開源操作系統。Ubuntu中國首席代表于立強透露&#xff0c;針對平板電腦的Ubuntu操作系統將在明年推出。 Ubuntu 12.04版開源操作系統發布 Ubuntu操作系統是一款開源操作系統&#xff0c;主要與OE…

scrapy框架異常--no more duplicates will be shown (see DUPEFILTER_DEBUG to show all duplicates)

解決方法&#xff1a; https://blog.csdn.net/qq_40176258/article/details/86527568 https://blog.csdn.net/weixin_39946931/article/details/88390797 謝謝博主分享&#xff01;

【BZOJ3590】[Snoi2013]Quare 狀壓DP

題解&#xff1a; 一道比較水的題 但這個測試數據極弱我也不知道我的代碼正確性是不是有保證 構成一個邊雙聯通 可以由兩個有一個公共點的邊雙聯通或者一個邊雙加一條鏈構成 所以我們需要要預處理出所有環 令f[i][j][k]表示起點為i&#xff0c;終點為j&#xff0c;經過點的狀態…

java swing簡介

UI 組件簡介 在開始學習 Swing 之前&#xff0c;必須回答針對真正初學者的一個問題&#xff1a;什么是 UI&#xff1f;初學者的答案是“用戶界面”。但是因為本教程的目標是要保證您不再只是個初學者&#xff0c;所以我們需要比這個定義更高級的定義。 所以&#xff0c;我再次…

定時任務 cron 表達式詳解

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 &#xff08;Spring定時任務的幾種實現&#xff1a;見博客另一頁&#xff1a;http://blog.csdn.net/jiangyu1013/article/details/54405…