【spider】selenium模擬點擊斗魚示例

from selenium import webdriver
import  timeurl = 'https://www.douyu.com/directory/all'# 動態html網頁加載可能出現的問題:element is not attached to the page document
# 標簽沒有及時的加載顯示出來,如果加載時間不夠,可能報錯
# try exceptclass Douyu(object):def __init__(self):self.driver = webdriver.Chrome()def start(self):self.driver.get(url)time.sleep(2)self.driver.find_element_by_class_name('pop-zoom-close').click()fp = open('douyu.txt', 'w', encoding='utf-8')with open('douyu.html','w',encoding='utf-8') as file:file.write(self.driver.page_source)while False:titles = self.driver.find_elements_by_css_selector('h3.ellipsis')nums = self.driver.find_elements_by_xpath('//span[@class="dy-num fr"]')print(len(titles),len(nums))for title,num in zip(titles[10:],nums):print('標題是:%s,觀戰人數:%s'%(title.text.strip(),num.text.strip()))fp.write('標題是:%s,觀戰人數:%s'%(title.text.strip(),num.text.strip())+'\n')'''<a href="#" class="shark-pager-next shark-pager-disable shark-pager-disable-next">下一頁</a><a href="#" class="shark-pager-next">下一頁</a>'''# 如果沒有找到flag = -1# 找到了,返回索引值flag = self.driver.page_source.find('shark-pager-disable-next')if flag != -1:break# 選中的當前頁碼'''<a href="#" class="shark-pager-item current">1</a>'''current_page = self.driver.find_element_by_xpath('//a[@class="shark-pager-item current"]').textprint('當前頁碼是:',current_page)try:self.driver.find_element_by_class_name('shark-pager-next').click()time.sleep(2)except:time.sleep(2)# 點擊進入最后一頁# xpath多重條件查詢,直接后面添加[][]self.driver.find_element_by_xpath('//a[contains(@class,"shark-pager-item")][last()]').click()fp.close()time.sleep(10)self.driver.quit()if '__main__' == __name__:douyu = Douyu()douyu.start()

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456231.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456231.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456231.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

webpack簡介

webpack是 前端資源模塊化管理工具和打包工具&#xff1b;webpack本身只能識別模塊引入&#xff0c;打包模塊的功能&#xff1b;webpack能識別ES Moudule、common JS等模塊規范一、現有模塊系統1、CommonJS關鍵詞&#xff1a;module.exports exports require特點&#xf…

【Python + Selenium】之JS定位總結

1、滾動條 driver.set_window_size(500,500) js "window.scrollTo(0,200)" #左&#xff1a;距左邊橫滾、右&#xff1a;距上邊豎滾 driver.execute_script(js) 2、獲取元素的值 button driver.find_element_by_css_selector("#su") #定位按鈕 input…

BigDecimal類整除報錯的解決方案

例如&#xff1a; BigDecimal num1 new BigDecimal("10"); BigDecimal num2 new BigDecimal("3"); BigDecimal num3 num1.divide(num2); 其實devide的函數定義如下 BigDecimal.divide(BigDecimal divisor, int scale, RoundingMode roundingMode) ;…

NodeJS中的require和import

ES6標準發布后&#xff0c;module成為標準&#xff0c;標準的使用是以export指令導出接口&#xff0c;以import引入模塊&#xff0c;但是在我們一貫的node模塊中&#xff0c;我們采用的是CommonJS規范&#xff0c;使用require引入模塊&#xff0c;使用module.exports導出接口。…

【selenium】selenium和requests登陸的區別

requests登陸 import requests import time t int(time.time()*1000) # 創建一個會話 s requests.Session() post_url http://account.chinaunix.net/login/login data {username: xxxxxxxxx,password: xxxxxxxxx,_token: nmSXhgHib8dTIC9DrATSkTzBBo4zz9eqDEPeG5i1,_t: t…

【spider】多線程爬蟲

多線程工作原理 多線程示意圖 Queue&#xff08;隊列對象&#xff09; queue是python中的標準庫&#xff0c;可以直接from queue import Queue引用;隊列是線程間最常用的交換數據的形式 python下多線程的思考 對于資源&#xff0c;加鎖是個重要的環節。Queue&#xff0c;是線…

css設置文字上下居中,一行文字居中,兩行或多行文字同樣居中。

HTML: <div class"book-detail-store-item align-center-vertical">居中文字</div> CSS: .book-detail-store-item {width: 50px&#xff1b;height&#xff1a;50px&#xff1b;line-height: 25px;font-size: 12px;}/*flex垂直居中對齊*/ .align-center…

MySQL/sqlserver查詢in操作 查詢結果按in集合順序顯示

2019獨角獸企業重金招聘Python工程師標準>>> MySQL/sqlserver查詢in操作 查詢結果按in集合順序顯示 MySQL用下面的語句 select * from ibs6_terminal_adv_inf where id in (16,14,15) order by field(id,16,14,15) select * from ibs6_terminal_adv_inf where id in…

【機器學習】opencv-人臉識別

一 . opencv是什么及其作用&#xff1f; OpenCV是一個基于BSD許可&#xff08;開源&#xff09;發行的跨平臺計算機視覺庫&#xff0c;可以運行在Linux、Windows、Android和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C 類構成&#xff0c;同時提供了Python…

關于java中的集合如何刪除一個元素。

我們有三種方法可以刪除集合中的元素&#xff0c;下面介紹兩種方法&#xff0c; 一種是傳統的for循環&#xff0c;另一種是使用Iterator迭代器(推薦使用)&#xff0c;簡單的介紹如下&#xff1a; for循環刪除元素: public class ForRemove<T>{ public void forDelete(…

她說程序員不懂浪漫,生日宴上慘變單身狗,其實,程序員的浪漫你不懂!

css蛋糕誰說程序員不懂得浪漫&#xff0c;只是程序員的浪漫你不懂&#xff01;PS&#xff1a;人家都不懂&#xff0c;你再浪漫有啥用&#xff0c;最后還不是單身狗&#xff1f;說實在的&#xff0c;以前也分享過一個程序員用純CSS畫的一個MAC&#xff0c;代碼就三千多行&#x…

H.264 picture parameter sets成員值含義學習筆記

-picture parameter sets1. pic_parameter_set_idpic_parameter_set_id指明了在切片頭中對應的某個psp.pic_parameter_set_id的值應該在0到255,包括0和2552. seq_parameter_set_idset_parameter_set_id表示激活的sps.seq_parameter_set_id應該取值在0到31之間,包括邊界值.3. en…

【機器學習】opencv-數據預處理

想要將收集好的數據s進行統一命名 數量整理 就需要提前進行預處理 import numpy as npimport osimport randomimport cv2 # wuao文件名修改&#xff0c;1~10文件名 filename os.listdir(./faces/wuao/) for i,name in enumerate(filename):os.rename(./faces/wuao/%s%(name)…

WIN7如何替換開機登錄畫面

1 把你的圖片保存為backgroundDefault.jpg,并確保和你的屏幕分辨率相同 2 把下面的代碼另存為開啟自定義登錄界面.reg&#xff08;注意格式為ASCII格式&#xff09; Windows Registry Editor Version 5.00 [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\A…

Resharper 安裝以及破解

首先進行軟件安裝 安裝后 解壓下載好的 文件 會得到如下&#xff1a; 打開序列號 會看到 然后 復制 %LocalAppData%\\JetBrains 路徑 會得到進入當前JetBrains 文件夾 然后搜索 JetBrains.Platform.Shell.dll 會得到這個文件 點擊屬性 查看到后半段的地址 \AppData\Local\JetB…

【機器學習】圖片中的人臉識別

通過opencv三方庫進行圖片人臉識別 face_zones中的參數可以自行調試,這三個data都可以用于人臉識別 haarcascade_frontalface_default.xmlhaarcascade_frontalface_alt.xmlhaarcascade_frontalface_alt2.xml import numpy as npimport cv2img cv2.imread(./2ren.jpg) img.s…

Android Fragment

Fragment在3.0后增加&#xff1a;android.app.Fragment。在v4的兼容包里也有。 一般為了兼容性還是可能會用&#xff1a;android.support.v4.app.Fragment 生命周期&#xff1a; onAttach,onCreate,onCreateView,onActivityCreated,onStart,onResume, onPause,onStop,onDestroy…

1020. 月餅 (25)

1020. 月餅 (25) 月餅是中國人在中秋佳節時吃的一種傳統食品&#xff0c;不同地區有許多不同風味的月餅。現給定所有種類月餅的庫存量、總售價、以及市場的最大需求量&#xff0c;請你計算可以獲得的最大收益是多少。 注意&#xff1a;銷售時允許取出一部分庫存。樣例給出的情形…

【機器學習】opencv-視頻中的人臉檢測

本次在圖片識別的程度上增添了視頻識別 原理就是在圖片的基礎上進行操作 每毫秒進行下一幀的人臉解析識別&#xff0c;時間可自行設置 import numpy as np import cv2win cv2.namedWindow(dzd,cv2.WINDOW_NORMAL) cv2.resizeWindow(dzd,640,200) rose cv2.imread(./rose.jp…

scan8[16+2*4]的內容

scan8確實不好理解&#xff0c;解答如下&#xff1a; static const int x264_scan8[162*4] { /* Luma */ 41*8, 51*8, 42*8, 52*8, 61*8, 71*8, 62*8, 72*8, 43*8, 53*8, 44*8, 54*8, 63*8, 73*8, 64*8, 74*8, /* Cb */ 11*8, 21*8, 12*8, 22*8, /…