使用Scrapy時出現雖然隊列里有很多Request但是卻不下載，造成假死狀態

使用Scrapy時出現雖然隊列里有很多Request但是卻不下載，造成假死狀態

news/2025/9/7 5:14:55/文章來源:https://blog.csdn.net/weixin_33730836/article/details/91881332

2019獨角獸企業重金招聘Python工程師標準>>>

DOWNLOAD_TIMEOUT

Default: 180

The amount of time (in secs) that the downloader will wait before timing out.

Note

This timeout can be set per spider using download_timeoutspider attribute and per-request using download_timeoutRequest.meta key.

http://doc.scrapy.org/en/latest/topics/settings.html

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

現象就是：

程序運行一段時間，可能是幾十分鐘或者幾個小時，然后后臺日志里面就不出現下載頁面的信息，一直顯示上一分鐘抓取了0個網頁的信息。

剛開始已經猜到是某些下載線程沒有正常執行回調方法引起程序一直以為線程還未下載完成，但是水平有限研究源碼未果。

經過不停的google終于發現一個有價值的信息，是給twisted提出的一個bugfix

連接地址如下http://twistedmatrix.com/trac/attachment/ticket/5773/patch1.diff#L739

?

為client加上了超時的限制，一定時間內如果無響應則執行設定的超時回調。

?

我把里面的timeout=0改成了timeout=10

替換后在運行scrapy程序，問題不再出現

?

附件中為替換好的文件，下載后直接去掉文件后綴 .rar即可

_newclient.py.rar (53.7 KB)
下載次數: 48

client.py.rar (53.5 KB)
下載次數: 30

轉載于:https://my.oschina.net/airship/blog/628765

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/285546.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/285546.shtml
英文地址，請注明出處：http://en.pswp.cn/news/285546.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

[轉]maven與java命名規則

[轉]maven與java命名規則

MAVEN 與 JAVA 包命名規范拋出問題在使用MAVEN搭建模塊化項目時，我的組織結構如下： root模塊文件夾名：package-module-project pom.xml文件： <project><groupId>com.chuillusion</groupId><artifactId>…

閱讀更多...

為什么 Istio 要使用 SPIRE 做身份認證？

為什么 Istio 要使用 SPIRE 做身份認證？

今年 6 月初，Istio 1.14 發布 [1] ，該版本中最值得關注的特性是新增對 SPIRE 的支持。SPIFFE[2] 和 SPIRE 都是 CNCF 孵化項目，其中 SPIRE 是 SPIFFE 的實現之一。本文將帶你了解 SPIRE 對于零信任架構的意義，以及 Istio 是為何使…

閱讀更多...

C語言試題106之有一對兔子，從出生后第 3 個月起每個月都生一對兔子，小兔子長到第三個月后每個月又生一對兔子，假如兔子都不死，問每個月的兔子總數為多少？

C語言試題106之有一對兔子，從出生后第 3 個月起每個月都生一對兔子，小兔子長到第三個月后每個月又生一對兔子，假如兔子都不死，問每個月的兔子總數為多少？

1、題目題目：有一對兔子，從出生后第 3 個月起每個月都生一對兔子，小兔子長到第三個月后每個月又生一對兔子，假如兔子都不死，問每個月的兔子總數為多少？分析：兔子的規律為數列 1,1,2,3,5,8,13,21… 2 、溫馨提示想獲取更多C語言題目請猛搓這里==========》200個C語言…

閱讀更多...

顯式強制類型轉換

顯式強制類型轉換

1. 日期顯式轉換為數字new Date; //1478845373322javascript有個奇特的語法，即構造函數沒有參數時可以不用帶()。不過最好還是使用ES5中新加入的靜態方法：Date.now()。2. ~運算符按位運算符只適用于32位整數，運算符會強制操作數使用32位格式。…

閱讀更多...

【ArcGIS風暴】ArcGIS Editor for OSM中文教程（2）：下載及加載OSM數據

【ArcGIS風暴】ArcGIS Editor for OSM中文教程（2）：下載及加載OSM數據

本文講解在ArcGIS中借助OpenStreetMap工具下載并加載OSM數據。文章目錄 1. 下載OSM數據2. 加載OSM數據1. 下載OSM數據在工具箱中雙擊Download OSM Data（XAPI）工具。 Download URL：http://www.overpass-api.de/api/xapi_meta? Downlaod Extent：與圖層lanzhou相同

閱讀更多...

Object.observe將不加入到ES7

Object.observe將不加入到ES7

先請看 Object.observe 的 API Object.observe(obj, callback[, acceptList])它用來監聽對象的變化，當給該對象添加屬性，修改屬性時都會被依次記錄下來看一個示例 var person {} Object.observe(person, function(arr) {var change arr[0]console.log…

閱讀更多...

Kafka學習征途：.NET Core操作Kafka

Kafka學習征途：.NET Core操作Kafka

【Kafka】| 總結/Edison Zhou1可用的Kafka .NET客戶端作為一個.NET Developer，自然想要在.NET項目中集成Kafka實現發布訂閱功能。那么，目前可用的Kafka客戶端有哪些呢？目前.NET圈子主流使用的是 Confluent.Kafkaconfluent-kafka-dotnet : htt…

閱讀更多...

C語言試題107之判斷 101至200 之間有多少個素數，并輸出所有素數。

C語言試題107之判斷 101至200 之間有多少個素數，并輸出所有素數。

?作者簡介：大家好我是碼莎拉蒂，CSDN博客專家?????? ??個人主頁：個人主頁 ??系列專欄：C語言試題200例 ??推薦一款模擬面試、刷題神器?? 點擊跳轉進入網站 1、題目題目：判斷 101至200 之間有多少個素數，并輸出所有素數分析：判斷素數的方法：用一個數分…

閱讀更多...

C語言將十進制輸出二進制、八進制、十六進制的方法總結

C語言將十進制輸出二進制、八進制、十六進制的方法總結

文章目錄方法一：直接輸出方法二：itoa函數方法一：直接輸出 C語言中，控制printf函數輸出格式的是格式字符，printf沒有直接打出2進制數的格式符，直接打出16進制的格式符是x格式符，即%x。 printf函數中輸出的格式為printf("<格式化字符串>", <參量表&…

閱讀更多...

[Android] 修改ImageView的圖片顏色

[Android] 修改ImageView的圖片顏色

有兩種方法： 方法1： ImageView imageView (ImageView) findViewById(R.id.arrow_image); Drawable tipsArrow imageView.getDrawable(); tipsArrow.setColorFilter(mContext.getResources().getColor(R.color.red_bg1), PorterDuf…

閱讀更多...

四叉樹算法

四叉樹算法

2019獨角獸企業重金招聘Python工程師標準>>> title: 四叉樹算法 date: 2016-1-11 15:10 categories: IOS tags: 算法小小程序猿我的博客：http://daycoding.com 轉載：http://blog.csdn.net/zhanxinhang/article/details/6706217 高德iOS聚合…

閱讀更多...

2019年中國教育信息化行業研究報告

2019年中國教育信息化行業研究報告

2019年中國教育信息化行業研究報告教育行業丨研究報告本文轉自：艾瑞咨詢核心摘要： 教育信息化2.0時代，教育相關政府/學校以更開放的姿態對待社會各類業態的進入，共建共享優質教育資源，提升教育公平與教育質量。同…

閱讀更多...

C語言試題109之將一個正整數分解質因數。例如：輸入 90,打印出 90=2乘3乘3乘5

C語言試題109之將一個正整數分解質因數。例如：輸入 90,打印出 90=2乘3乘3乘5

?作者簡介：大家好我是碼莎拉蒂，CSDN博客專家?????? ??個人主頁：個人主頁 ??系列專欄：C語言試題200例 ??推薦一款模擬面試、刷題神器?? 點擊跳轉進入網站 1、題目題目：將一個正整數分解質因數。例如：輸入 90,打印出 90=233*5。分析：對 n 進行分解質因…

閱讀更多...

【ArcGIS遇上Python】使用add-in向導開發ArcGIS插件（1）：add-in工具介紹及安裝

【ArcGIS遇上Python】使用add-in向導開發ArcGIS插件（1）：add-in工具介紹及安裝

文章目錄 addin介紹addin開發方式Python Add-In開發addin下載addin安裝基于ArcObject/ArcGIS Engine的Add-In開發addin介紹 ArcGIS從10.0開始支持addin（ArcGIS軟件中又叫作加載項）的方式進行插件制作。相對于以往9.x系列，addin的無論是從使用或者編寫都更加方便快捷。通過開…

閱讀更多...

dotnet 使用 Crossgen2 對 DLL 進行 ReadyToRun 提升啟動性能

dotnet 使用 Crossgen2 對 DLL 進行 ReadyToRun 提升啟動性能

我對幾個應用進行嚴格的啟動性能評估，對比了在 .NET Framework 和 dotnet 6 下的應用啟動性能，非常符合預期的可以看到，在用戶的設備上，經過了 NGen 之后的 .NET Framework 可以提供非常優越的啟動性能，再加上 .NET Fr…

閱讀更多...

使用myeclipse建立maven項目(重要)

使用myeclipse建立maven項目(重要)

maven是管理項目的，myeclipse是編寫代碼的。第一次寫項目都要配置好多東西，很麻煩，now 來看看怎樣新建一個maven項目。工具/原料 myeclipsemaven方法/步驟因為教程使用的maven是自己下載配置的，并沒有使用myeclipse自帶的&#…

閱讀更多...

LeetCode 每日一題 Day 22 || 枚舉(數學方法）/二分

LeetCode 每日一題 Day 22 || 枚舉(數學方法）/二分

1954. 收集足夠蘋果的最小花園周長給你一個用無限二維網格表示的花園，每一個整數坐標處都有一棵蘋果樹。整數坐標 (i, j) 處的蘋果樹有 |i| |j| 個蘋果。你將會買下正中心坐標是 (0, 0) 的一塊正方形土地 ，且每條邊都與兩條坐標軸之一平行。給你…

閱讀更多...

不用@微信官網了，用python給自己的微信頭像加個小國旗

不用@微信官網了，用python給自己的微信頭像加個小國旗

國旗LOGO（png透明格式）： 微信頭像合成結果： import base64 import os import re from io import BytesIO from PIL import Image import tkinter as tk from tkinter import filedialog# 水印圖片可以自己指定 #markImageImage…

閱讀更多...

getContentResolver().query()方法selection參數使用詳解（轉）

getContentResolver().query()方法selection參數使用詳解（轉）

如何在managedQuery()和getContentResolver().query()方法中實現結果去重有時候，我們需要對查詢的數據庫結果進行去重。在SQL中我們可以通過distinct關鍵字實現，但是當我們使用android提供的managedQuery()或getContentResolver().query()方法對數據庫進…

閱讀更多...

C語言試題106之有一對兔子問題

C語言試題106之有一對兔子問題

?作者簡介：大家好我是碼莎拉蒂，CSDN博客專家?????? ??個人主頁：個人主頁 ??系列專欄：C語言試題200例 ??推薦一款模擬面試、刷題神器?? 點擊跳轉進入網站 1、題目題目：有一對兔子，從出生后第 3 個月起每個月都生一對兔子，小兔子長到第三個月后每個月又…

閱讀更多...

最新文章