python 裁判文書網_python - 用selenium模擬登陸裁判文書網，系統報錯找不到元素。...

問題

from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

dcap = dict(DesiredCapabilities.PHANTOMJS)

dcap["phantomjs.page.settings.userAgent"]=("Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36")

url ="http://wenshu.court.gov.cn/User/RegisterAndLogin?Operate=1"

driver = webdriver.PhantomJS(executable_path='C:\\Users\\wang\\Downloads\\phantomjs-2.1.1-windows\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe')

driver.get(url)

import time

time.sleep(30)

driver.find_element_by_xpath('//*[@id="login_Name"]').send_keys("398915607@qq.com")

driver.find_element_by_xpath('//*[@id="login_Pwd_Temp"]').send_keys("wstktb")

driver.find_element_by_xpath('//*[@id="btnLogin"]').click()

driver.quit()

chrome上觀察源碼明明都有的，這個網站看來看去也沒有frame的標簽，打印page_source也只有幾行js代碼。，小弟最近剛開始學習爬蟲，實在是十分困惑啊，懇請各位求教。

解決方案

我測試了一下，第一次打開這個頁面的時候，如果你沒有他需要的cookie，那么你進入的就是那個全是js的頁面，HTTP狀態碼202，此時該域名下會生成一個cookie(我不確定怎么來的)。

然后瀏覽器會自動刷新，js會在請求中加入一段cookie(該cookie不保存在瀏覽器，且每次都不一樣)，服務端返回正常的頁面，HTTP狀態碼200。

題主可以用chrome的view-source來測試。

所以你說的source只有幾行代碼那就是第一次打開的情況，我對selenium不是很了解，不過應該是因為沒有自動跳轉的問題，具體原因可能是你的配置、js中有判斷。

掃一掃關注IT屋

微信公眾號搜索 “ IT屋 ” ，選擇關注與百萬開發者在一起

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/455269.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/455269.shtml
英文地址，請注明出處：http://en.pswp.cn/news/455269.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！