Max retries exceeded with url 解決方案

問題解決方案

在上一篇問題解決中：python OSError: [Errno 24] Too many open files | HTTPConnectionPool(host=‘‘, port=80): Max retries e
有提到修改本地進程最大文件數來避免Max retries exceeded with url 報錯，也談到如果請求api端有請求數量限制，仍然是拉取不到結果的。這時我們就要限制我們請求的頻率了。
下面有三個常見的方法：
1、增加重試連接次數：
requests.DEFAULT_RETRIES = 5
2、關閉多余的鏈接：
默認的http connection是keep-alive的，在post請求中，header中有這樣一個字段：Connection，我們將其置為’close’

monitor_header = {"Content-type":"application/json","Accept":"*/*","Connection":"close","X-API-Version":"v1","projectname": "wemeet","appname": "media_proxy","token": "2e962d4104a2c28477ab7f38883b79bb"
}

http是一個無狀態的面向連接的協議。
http無狀態：無狀態協議是指http協議本身對于事務處理沒有記憶功能，服務器不知道瀏覽器的狀態。通俗的即使你登錄了，去訪問同一個網站的不同網頁，服務器都不會知道你是誰，如果需要記錄登錄用戶的信息，用戶操作，用戶行為等數據需要使用cookie或session來存儲。

keep-alive：從HTTP/1.1起，瀏覽器默認都開啟了Keep-Alive，保持連接特性，客戶端和服務器都能選擇隨時關閉連接，則請求頭中為connection:close。簡單地說，當一個網頁打開完成后，客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉，如果客戶端再次訪問這個服務器上的網頁，會繼續使用這一條已經建立的TCP連接。但是Keep-Alive不會永久保持連接，它有一個保持時間，可以在不同的服務器軟件（如Apache）中設定這個時間。

誤解：無狀態不代表HTTP不能保持TCP連接，更不能代表HTTP使用的是UDP協議（無連接）。即使http在無狀態下，只要客戶端和服務器的頭部信息connection:keep-alive，則在有效期內他們使用同一條TCP連接。
3、請求時增加緩沖延時
由于我這里是多線程進行post請求，總共有2744個線程。這里進行分批次的發請求，發完一次sleep一段時間：

def get_machine_quality(mapping):threads = []list_machine_obj = []now_time = time.time()for value in mapping.values():for v in value:machine_obj = quality_data(v, 0, now_time)list_machine_obj.append(machine_obj)index = 0for value in mapping.values():for v in value:# 創建新線程thread_tmp = my_thread(v, threadfunc_get_machine_quality, list_machine_obj[index])# 添加線程到線程列表threads.append(thread_tmp)index += 1# 開啟新線程length = len(threads)part = 4for i in range(0,part):start = int(i / part * length)end = int((i + 1) / part * length)for i in range(start, end):threads[i].start()for i in range(start, end):threads[i].join()time.sleep(40)print(str(start) + "to" + str(end))logging.critical(str(start) + "to" + str(end))# print ("退出主線程")return list_machine_obj

keep alive 與close使用場景

1、當你的Server內存充足時，KeepAlive =On還是Off對系統性能影響不大。
2、當你的Server上靜態網頁(Html、圖片、Css、Js)居多時，建議打開KeepAlive 。
3、當你的Server多為動態請求(因為連接數據庫，對文件系統訪問較多)，KeepAlive 關掉，會節省一定的內存，節省的內存正好可以作為文件系統的Cache(vmstat命令中cache一列)，降低I/O壓力。
PS：當KeepAlive =On時，KeepAliveTimeOut的設置其實也是一個問題，設置的過短，會導致Apache 頻繁建立連接，給Cpu造成壓力，設置的過長，系統中就會堆積無用的Http連接，消耗掉大量內存，具體設置多少，可以進行不斷的調節，因你的網站瀏覽和服務器配置而異。

參考：
解決Max retries exceeded with url的問題
轉：Connection: close和Connection: keep-alive有什么區別？

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/376718.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/376718.shtml
英文地址，請注明出處：http://en.pswp.cn/news/376718.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！