python selenium對象怎么序列化_python selenium爬取斗魚

不加延遲報錯selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {“method”:”xpath”,”selector”:”.//span[@class=”DyListCover-hot”]”}

(Session info: chrome=80.0.3987.122)

a50b6635213e9d3bc66071bc4624b4f4.png最開始以為是版本問題,不過應該不會,我檢查了下版本

然后我注釋掉這一段

cb958cd70a0d1666e01668a0c4aaf2e3.png

然后報Message: stale element reference: element is not attached to the page document

e2cde18ef5b63c3bd09aa9fd2c314697.png

但是卻爬取到一段消息

67cdaaf26ed086f6542fd2546b1afbc3.png

說明有可能是延時的問題,在開頭加上延時,ok

附上源碼

import json

import time

from selenium import webdriver

driver=webdriver.Chrome()

driver.get("https://www.douyu.com/directory/all")

# driver.close()

#

def douyu():

##要加延遲,不然要報錯 time.sleep(5)

li_list=driver.find_elements_by_xpath('//*[@id="listAll"]/section[2]/div[2]/ul/li')

# print(list_all)

content_dict={}

for li in li_list:

content_dict["title"]=li.find_element_by_xpath(".//h3").text

content_dict["belong"]=li.find_element_by_xpath('.//span[@class="DyListCover-zone"]').text

content_dict["hot"]=li.find_element_by_xpath('.//span[@class="DyListCover-hot"]').text

content_dict["author"] = li.find_element_by_xpath(".//h2").text

print(content_dict)

#將字典轉換為字符串便于存儲

s=json.dumps(content_dict,ensure_ascii=False) #json序列化默認對中文采用ascii編碼,所以False

with open("douyu.txt","a",encoding="utf-8") as f:

f.write(s+'\n')

next_url=driver.find_elements_by_xpath('//li[@title="下一頁"]/span[@class="dy-Pagination-item-custom"]')

#三元表達式

next_url=next_url[0] if len(next_url) > 0 else None

while next_url is not None:

next_url.click()

time.sleep(3)

#我調我自己 點擊下一頁停5s繼續爬取 延時設在開頭 douyu()

douyu()

72ddd16c69f8d1cbaa6d73dc34bca0e0.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/534952.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/534952.shtml
英文地址,請注明出處:http://en.pswp.cn/news/534952.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

神經網絡的全連接層_深度神經網絡全連接層

一、概念全連接層一般在網絡的最后部分做分類輸出,全連接層的有m個輸入和n個輸出,每一個輸出都和所有的輸入相連,相連的權重w都是不一樣的,同時每一個輸出還有一個bias。二、前向全連接假設輸入是4,輸出是4&#xff0c…

vs 選定內容沒有屬性頁_從智能單品,到全屋智能:2019中國智能家居發展白皮書【附82頁PPT】...

2019年,智能家居行業在技術、市場和行業的變革中迎接新的挑戰和機遇。一方面,AI、IoT、邊緣計算全面賦能智能家居;另一方面,中國的房地產行業正在從上半場的“增量開發”,切換到下半場的“存量經營”、“樓盤精裝化”政…

python決策樹的應用_機器學習-決策樹實戰應用

1.下載2.安裝:雙擊3.創建桌面快捷方式安裝目錄\bin文件夾\:找到gvedit.exe文件右鍵 發送到桌面快捷方式,如下圖:4.配置環境變量將graphviz安裝目錄下的bin文件夾添加到Path環境變量中:5.驗證是否安裝并配置成功進入win…

【SSM面向CRUD編程專欄 3】關于黑馬程序員最全SSM框架教程視頻,P37集老師跳過的模塊創建以及tomcat下載安裝配置和運行等諸多問題

寫在前面:? 本人是在學習B站黑馬程序員SSM框架教程視頻的時候在P37集遇到了問題,如果不解決還沒辦法往下接著聽,老師跳過的模塊創建以及tomcat下載安裝配置和運行等諸多問題,全在這篇博客中得到了解決 😢解決上…

python人臉識別源碼_Python 抖音機器人,讓你找到漂亮小姐姐

本項目作者沉迷于抖音無法自拔,常常花好幾個小時在抖音漂亮小姐姐身上。本著高效、直接地找到漂亮小姐姐的核心思想,我用 Python ADB 做了一個 Python 抖音機器人 Douyin-Bot。特性自動翻頁顏值檢測人臉識別自動點贊自動關注隨機防 Ban自動評論原理打開…

thinkphp josn mysql_ThinkPHP:JSON字段類型的使用(ORM)

ThinkPHP5.1版本正式發布已經有一段時間了,我會陸續給大家介紹其中的新特性。今天要給大家介紹的是一個可能很多用戶還不了解的一個特性:JSON字段數據支持。不過首先注意一點,本篇內容中描述的JSON字段數據的支持是從V5.1.4版本引入的。由于包…

獲取http地址如何從上面抓取圖片_用 Python 自動抓取妹子圖

目錄前言Media Pipeline啟用Media Pipeline使用 ImgPipeline抓取妹子圖瞎比比與送書后話前言我們在抓取數據的過程中,除了要抓取文本數據之外,當然也會有抓取圖片的需求。那我們的 scrapy 能爬取圖片嗎?答案是,當然的。說來慚愧&a…

MySQL摘要_mysql摘要

2011-04-15(1)mysqld關閉命令:mysqladmin -u root shutdown。注意:windows命令以enter結束不是;,mysql命令行才是(2)mysql終端接入,修改mysql.user表內容,添加授權用戶。insert into mysql.user(Host,User,Password,ss…

錯誤代碼0x800f0950怎么解決_解決win10安裝net framework 3.5失敗(錯誤代碼 0x800F0950)...

視頻教程:Win10教程 安裝net framework 3.5失敗(錯誤代碼 0x800F0950)_嗶哩嗶哩 (゜-゜)つロ 干杯~-bilibili?www.bilibili.com一:出現問題:報錯代碼二:解決步驟1.通過命令提示符明確自己系統版本Windows鍵X ,打開(命…

java mysql dump_Java 調用Mysql dump 備份數據庫

SimpleDateFormat sdf new SimpleDateFormat("yyyyMMddHHmmss");try {String name sdf.format(new Date());String filePath System.getProperty("user.dir") "//" name ".sql";// 系統執行器Runtime rt Runtime.getRuntime();…

python 日志不會按照日期分割_django實現日志按日期分割

settings文件中配置: LOGGING { version:1, disable_existing_logger:False, formatters:{ verbose:{ format:%(asctime)s \"%(pathname)s:%(module)s:%(funcName)s:%(lineno)d\" [%(levelname)s]-%(message)s }, }, # 處理器 handlers:{ # 輸…

mysql事務隔離最高_Mysql事務隔離級別

mysql官方文檔顯示:InnoDB中每個隔離級別的詳細描述如下: READ UNCOMMITTEDSELECT語句以非鎖定方式被執行,但是一個可能更早期版本的記錄會被用到。因此,使用這個隔離級別,比如,讀是不連貫的。著也被稱為“…

exe打包工具哪個最好_一鍵分發工具哪個最好用?這款30萬人都在用,很優秀!...

現代化媒體對于傳播越來越重要,16年到如今,視頻內容產業實在有話題度,其高效的粉絲互動機制、低資金投入高額回報等等亮點,強烈吸引著數以百萬計的創造者,為了達到極其出色的閱讀量,這些人往往會運用到所有…

mysql備份服務器中的_使用 Shell 備份遠程服務器上的 MySQL 數據庫到本機

適用場景:遠程服務器上的 MySQL 不允許遠程訪問,此時我們需要先登錄服務器,備份數據庫后,將備份文件拉取到本機。源碼 mysqlDumpRemote2Local.sh#!/bin/bash################################################# TODO: 登錄遠程服務…

date轉timestamp格式_技術分享 | MySQL:timestamp 時區轉換導致 CPU %sy 高的問題

作者:高鵬文章末尾有他著作的《深入理解 MySQL 主從原理 32 講》,深入透徹理解 MySQL 主從,GTID 相關技術知識。本文為學習記錄,可能有誤請諒解。本文建議PC端觀看,效果更佳。這個問題是一個朋友遇到的風云&#xff0c…

mysql架構組成_第 2 章 MySQL 架構組成

麻雀雖小,五臟俱全。MySQL 雖然以簡單著稱,但其內部結構并不簡單。本章從MySQL物理組成、邏輯組成,以及相關工具幾個角度來介紹 MySQL 的整體架構組成,希望能夠讓讀者對 MySQL 有一個更全面深入的了解。2.1 MySQL物理文…

python列表生成器語法_python列表生產式和生成器

1.列表生成式:通過簡潔的語法可以對一組元素進行過濾 格式:[exp for val in collection if condition] 例子1: a [x*xforxinxrange(1,10)ifx%20] print(a) 1)append(): 該方法用于在列表末尾添加新的對象,…

win2008 mysql端口_使用自定義端口連接SQL Server 2008的方法

使用過SQL Server的人大多都知道,SQL Server服務器默認監聽的端口號是1433,但是我今天遇到的問題是我的機器上有三個數據庫實例,這樣使用TCP/IP遠程連接時就產生了問題。如何在Microsoft SQL Server Management Studio里加入端口號連接呢&…