無頭瀏覽器與Selenium:探索無界爬蟲的奇妙世界

selenium設置無頭瀏覽器

背景

? 我們之前的selenium都是瀏覽器驅動自動打開一個網頁,執行相關操作,其實也可以讓其后臺顯示,不用在前臺顯示。

? 要設置無頭瀏覽器,可以使用Selenium的Headless模式。在Headless模式下,Selenium會在后臺運行瀏覽器,而不會顯示實際的瀏覽器窗口。

優點:

無頭瀏覽器(Headless Browser)是指在沒有圖形用戶界面(GUI)的情況下運行的瀏覽器。它能夠執行和顯示網頁,但不會顯示實際的瀏覽器窗口。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
# 創建ChromeOptions對象
chrome_options = Options()
# 在ChromeOptions中設置無頭模式
chrome_options.add_argument("--headless")
# 實例化Chrome瀏覽器對象,并將ChromeOptions對象傳遞給它
driver = webdriver.Chrome(options=chrome_options)
# 在無頭瀏覽器中執行相關操作
driver.get("https://www.example.com")
# 進行其他操作...
# 關閉瀏覽器
driver.quit()

案例:

實戰案例一:

? 要求:使用無頭瀏覽器訪問百度,然后截個圖保存到本地

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time# 創建一個參數對象,用來控制chrome以無界面模式打開
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
# 驅動路徑
path = './chromedriver.exe'
# 創建瀏覽器對象
browser = webdriver.Chrome(executable_path=path,options=chrome_options)# 上網
url = 'http://www.baidu.com/'
browser.get(url)
time.sleep(3)
# 截圖 看個結果
browser.save_screenshot('baidu.png')browser.quit()

在這里插入圖片描述

實戰案例二:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options# 驅動路徑
path = r'D:\Downloads\xx\chromedriver-win64\chromedriver.exe'# 創建一個參數對象,用來控制Chrome以無界面模式打開
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')# 創建瀏覽器對象
browser = webdriver.Chrome(executable_path=path, options=chrome_options)# 打開網頁
url = 'http://www.baidu.com'
browser.get(url)# 定位元素并執行操作
search_input = browser.find_element_by_id('kw')  # 根據ID定位搜索輸入框
search_input.send_keys('Hello, World!')  # 在搜索輸入框中輸入文本search_button = browser.find_element_by_id('su')  # 根據ID定位搜索按鈕
search_button.click()  # 點擊搜索按鈕# 等待頁面加載
browser.implicitly_wait(5)  # 隱式等待5秒鐘# 獲取搜索結果
results = browser.find_elements_by_css_selector('.result')  # 根據CSS選擇器定位搜索結果
for result in results:print(result.text)  # 打印搜索結果的文本內容# 關閉瀏覽器
browser.quit()

在這里插入圖片描述

? 首先創建了一個參數對象chrome_options,用來控制Chrome以無界面模式打開。然后使用webdriver.Chrome()方法創建了一個Chrome瀏覽器對象,并傳入驅動路徑和參數對象。接下來,使用get()方法打開了百度的網頁。然后使用find_element_by_*方法定位了搜索輸入框和搜索按鈕,并執行了相應的操作。在搜索結果的部分,使用find_elements_by_css_selector()方法定位了所有的搜索結果,并通過循環打印了每個搜索結果的文本內容。最后使用quit()方法關閉了瀏覽器。

溫馨提示:

僅供學習參考,請勿用于數據獲取。本案例僅旨在展示數據獲取技術的應用和原理,并提供學習參考。請注意,未經授權的數據獲取可能涉及法律和道德問題。在進行任何數據獲取活動之前,請確保遵守相關法律法規和網站的規定。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/206705.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/206705.shtml
英文地址,請注明出處:http://en.pswp.cn/news/206705.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

鴻蒙(HarmonyOS)應用開發——web組件

簡述 在開發的工作中,可能存在一個場景,我們有一個問卷調查的h5頁面,需要切入到app 中。這個時候,就需要從app 端操作,切換到web端操作。不管是安卓、ios、小程序都提供有web組件。那么harmonyos 中也提供web組件來在…

Kafka中的Topic

在Kafka中,Topic是消息的邏輯容器,用于組織和分類消息。本文將深入探討Kafka Topic的各個方面,包括創建、配置、生產者和消費者,以及一些實際應用中的示例代碼。 1. 介紹 在Kafka中,Topic是消息的邏輯通道&#xff0…

【華為數據之道學習筆記】3-2 基礎數據治理

基礎數據用于對其他數據進行分類,在業界也稱作參考數據。基礎數據通常是靜態的(如國家、幣種),一般在業務事件發生之前就已經預先定義。它的可選值數量有限,可以用作業務或IT的開關和判斷條件。當基礎數據的取值發生變…

GSAP動畫庫,探究蘋果官網頁面滾動動畫是如何實現的

GSAP動畫庫,探究蘋果官網頁面滾動動畫是如何實現的 前言 每次瀏覽蘋果官網時都在好奇,當我們向下滾動頁面時一個個文字或圖片總能緩緩浮現,往上滾動時又能慢慢收起來,這就究竟是如是實現的呢。在查閱一些資料時發現了Scrollmagi…

基于OpenCV+CNN+IOT+微信小程序智能果實采摘指導系統——深度學習算法應用(含pytho、JS工程源碼)+數據集+模型(五)

目錄 前言總體設計系統整體結構圖系統流程圖 運行環境Python環境TensorFlow 環境Jupyter Notebook環境Pycharm 環境微信開發者工具OneNET云平臺 模塊實現1. 數據預處理2. 創建模型并編譯3. 模型訓練及保存4. 上傳結果5. 小程序開發1)查詢圖片2)查詢識別結…

paypal貝寶怎么綁卡支付

一、PayPal是什么 PayPal是一個很多國家地區通用的支付渠道,我們可以把它理解為一項在線服務,相當于美國版的支付寶。你可以通過PayPal進行匯款和收款,相比傳統的電匯和西聯那類的匯款方式,PayPal更加簡單和容易,被很…

利用proteus實現串口助手和arduino Mega 2560的串口通信

本例用到的proteus版本為8.13,ardunio IDE版本為2.2.1,虛擬串口vspd版本為7.2,串口助手SSCOM V5.13.1。軟件的下載安裝有很多教程,大家可以自行搜索,本文只介紹如何利用這4種軟件在proteus中實現arduino Mega 2560的串…

Day45| 爬樓梯 (進階)Leetcode 322. 零錢兌換 Leetcode 279. 完全平方數

爬樓梯 &#xff08;進階&#xff09; 題目鏈接 爬樓梯&#xff08;進階版&#xff09; 本題目屬于排列中的背包問題&#xff0c;所以先遍歷背包&#xff0c;后遍歷物品&#xff0c;剩下的就是完全背包的板子了&#xff0c;下面直接上代碼&#xff1a; #include<iostream…

刷題記錄--算法--簡單

第一題 2582. 遞枕頭 已解答 簡單 相關標簽 相關企業 提示 n 個人站成一排&#xff0c;按從 1 到 n 編號。 最初&#xff0c;排在隊首的第一個人拿著一個枕頭。每秒鐘&#xff0c;拿著枕頭的人會將枕頭傳遞給隊伍中的下一個人。一旦枕頭到達隊首或隊尾&#xff0c;傳遞…

高防IP是什么?有什么優勢?

隨著互聯網的普及和快速發展&#xff0c;網絡安全問題日益突出。在眾多安全問題中&#xff0c;DDOS攻擊是一種常見的攻擊手段&#xff0c;它通過發送大量的無效或低效請求&#xff0c;使得目標服務器無法響應正常用戶的請求&#xff0c;從而造成服務不可用的情況。為了解決這個…

部署zabbix

源碼下載地址&#xff1a; Download Zabbix sources nginx: download 防火墻和selinux都需要關閉 1、部署監控服務器 1&#xff09;安裝LNMP環境 Zabbix監控管理控制臺需要通過Web頁面展示出來&#xff0c;并且還需要使用MySQL來存儲數據&#xff0c;因此需要先為Zabbix準備基礎…

vue的el

類型&#xff1a;string | Element 限制&#xff1a; 只在用 new 創建實例時生效。 詳細&#xff1a; 提供一個在頁面上已存在的 DOM 元素作為 Vue 實例的掛載目標。可以是 CSS 選擇器&#xff0c;也可以是一個 HTMLElement 實例。 在實例掛載之后&#xff0c;元素可以用 vm.…

Java創建線程有哪幾種方式?

Java創建線程有哪幾種方式&#xff1f; 在 Java 中&#xff0c;創建線程有多種方式&#xff0c;主要包括使用 Thread 類和實現 Runnable 接口。以下是幾種常見的創建線程的方式&#xff1a; 繼承 Thread 類&#xff1a; 通過繼承 Thread 類并重寫 run 方法來創建線程。 class …

如何使用eXtplorer+cpolar內網穿透搭建個人云存儲實現公網訪問

文章目錄 1. 前言2. eXtplorer網站搭建2.1 eXtplorer下載和安裝2.2 eXtplorer網頁測試2.3 cpolar的安裝和注冊 3.本地網頁發布3.1.Cpolar云端設置3.2.Cpolar本地設置 4.公網訪問測試5.結語 1. 前言 通過互聯網傳輸文件&#xff0c;是互聯網最重要的應用之一&#xff0c;無論是…

關于互聯網安全方面需要了解的一些知識

關于互聯網安全方面需要了解的一些知識 文章目錄 關于互聯網安全方面需要了解的一些知識一、資產掃描二、漏洞掃描三、滲透測試四、POC五、Exp六、代碼規范七、函數命名八、注釋怎么寫 一、資產掃描 資產掃描是一種通過掃描網絡或系統中所有設備、應用程序和服務&#xff0c;識…

PHP escapeshellarg()+escapeshellcmd()繞過

文章目錄 函數利用escapeshellarg()函數escapeshellcmd()函數 exp執行原理攻擊面例題 [BUUCTF 2018]Online Tool例題 [網鼎杯 2020 朱雀組]Nmap 函數利用 escapeshellarg()函數 單引號 ()&#xff1a;轉義為 \。 雙引號 (")&#xff1a;轉義為 \"。 反斜杠 (\)&…

HTTP不同場景下的通信過程和用戶上網認證過程分析

目錄 HTTP不同場景的通信過程 HTTP正常交互過程 HTTP透明加速傳輸過程 HTTP代理服務器場景下交互過程 通過AC對上網用戶不同場景的認證過程 AC上網認證正常交互過程 通過Cookie實現免認證交互過程 代理服務器場景下HTTP密碼認證交互過程 HTTP不同場景的通信過程 HTTP、…

專業130+總分400+云南大學通信847專業基礎綜考研經驗(原專業課827)

今年專業130總分400云南大學通信上岸&#xff0c;整體考研感覺還是比較滿意&#xff0c;期間也付出了很多心血&#xff0c;走過彎路&#xff0c;下面分享一下這一年考研得失&#xff0c;希望大家可以從中有所借鑒。 先說明我在考研報名前更換成云南大學的理由&#xff1a;&…

谷歌正式發布最強 AI 模型 Gemini

2023年12月6日&#xff0c;谷歌公司宣布推出其被認為是規模最大、功能最強大的人工智能模型 Gemini。 Gemini將分為三個不同的套件&#xff1a;Gemini Ultra、Gemini Pro和Gemini Nano。 Gemini Ultra被認為具備最強大的能力&#xff0c;Gemini Pro則可擴展至多任務&#x…

xilinx原語詳解及仿真——ODDR

ODDR位于OLOGIC中&#xff0c;可以把單沿傳輸的數據轉換為雙沿傳輸的數據&#xff0c; 在講解ODDR功能之前&#xff0c;需要先了解OLOGIC的結構及功能。 1、OLOGIC OLOGIC塊位于IOB的內側&#xff0c;FPGA內部信號想要輸出到管腳&#xff0c;都必須經過OLOGIC。OLOGIC資源的類…