在docker中搭建selenium 爬蟲環境(3分鐘快速搭建)

1、安裝docker

? ? ? ? 省略

2、拉取鏡像

docker pull selenium/standalone-chrome-debug

3、運行容器

docker run -d -p 4444:4444 -p 5900:5900 -v C:\Users\Public\VNC_Donwnloads:/home/seluser/Downloads  --memory=6g --name selenium_chrome selenium/standalone-chrome-debug

其中 4444 是連接端口,5900是 vnc遠程連接接口,內存限制6g 建議設置成2g(博主主機內存大),

C:\Users\Public\VNC_Donwnloads:/home/seluser/Downloads 其中C:\Users\Public\VNC_Donwnloads 是下載主機目錄,因為博主docker在wsl內。

/home/seluser/Downloads 是容器內chrome 下載文件的地址(固定的,不用去改動)

4、連接容器桌面

連接vnc可以查看到容器內桌面,方便開發調試

下載vnc遠程連接工具 推薦下載:RealVNC? - Remote access software for desktop and mobile | RealVNC

輸入? ip:端口? 和密碼, 密碼 默認為secret

成功進入 fluxbox桌面

可以看到已經安裝好了chrome

5、編寫測試代碼?

博主使用java進行編寫?測試代碼,當然使用其他語言也是類似的

maven

   <dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>4.17.0</version></dependency>

示例:

import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.remote.RemoteWebDriver;import java.net.MalformedURLException;
import java.net.URL;public class Main {public static void main(String[] args)  {WebDriver driver=null;try {// 遠程Selenium 服務器地址URL seleniumHub=new URL("http://localhost:4444/wd/hub");// 創建optionsChromeOptions options=new ChromeOptions();// 創建遠程WebDriverdriver= new RemoteWebDriver(seleniumHub,options);// 跳轉百度界面driver.get("https://www.baidu.com");// 獲取頁面htmlString html = driver.getPageSource();System.out.println(html);// 5秒后結束程序Thread.sleep(5000);}catch (Exception e){e.printStackTrace();}finally {if(driver!=null){// 關閉窗口driver.close();// 關閉程序driver.quit();}}}
}

效果:

覺得對你有幫助歡迎? ?點贊? 收藏。?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/716113.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/716113.shtml
英文地址,請注明出處:http://en.pswp.cn/news/716113.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue中commit和dispatch區別及其用法辨析

在Vue中&#xff0c;commit和dispatch是兩個用于觸發 Vuex store 中的 mutations 和 actions 的方法。 區別 commit: 用于觸發 mutations&#xff0c;即直接修改 state 的同步操作。通過commit方法可以調用 store 中的 mutations&#xff0c;并且只能同步地執行。使用方式如下…

大數據核心技術概論

大數據核心技術概述 大數據基石三大論文&#xff1a;GFS&#xff08;Hadoop HDFS&#xff09;、BigTable&#xff08;Apache HBase&#xff09;、MapReduce&#xff08;Hadoop MapReduce&#xff09;。 搜索引擎的核心任務&#xff1a;一是數據采集&#xff0c;也就是網頁的爬…

matlab 感知器算法

1. 原理 兩類線性可分的模式類&#xff1a;&#xff0c;設判別函數為&#xff1a;。 對樣本進行規范化處理&#xff0c;即類樣本全部乘以(-1)&#xff0c;則有&#xff1a; 感知器算法通過對已知類別的訓練樣本集的學習&#xff0c;尋找一個滿足上式的權向量。 2. 過程 2.1 …

力扣 分割回文串

輸出的是不同的分割方案 class Solution { public:vector<vector<bool>>flag;vector<string>ans;vector<vector<string>>nums;void dfs(string &s,int i){int ns.size();if(in){i表示s長度&#xff0c;等于即全部分割完畢nums.push_back(ans…

第十三篇【傳奇開心果系列】Python的文本和語音相互轉換庫技術點案例示例:Microsoft Azure的Face API開發人臉識別門禁系統經典案例

傳奇開心果博文系列 系列博文目錄Python的文本和語音相互轉換庫技術點案例示例系列 博文目錄前言一、實現步驟和雛形示例代碼二、擴展思路介紹三、活體檢測深度解讀和示例代碼四、人臉注冊和管理示例代碼五、實時監控和報警示例代碼六、多因素認證示例代碼七、訪客管理示例代碼…

mac m3安裝nvm安裝說明;mac安裝xbrew

安裝說明說明&#xff1a; 1.安裝brew /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"2.安裝nvm brew install nvm3.創建.nvm目錄 mkdir ~/.nvm4.編輯 ~/.zshrc 配置文件 vi ~/.zshrc5.在 ~/.zshrc 配置文件內添加內…

03-JNI 類型和數據結構

上一篇&#xff1a; 02-設計概述 本章討論 JNI 如何將 Java 類型映射為本地 C 類型。 3.1 原始類型 下表描述了 Java 原始類型及其與機器相關的本地等價類型。 為方便起見&#xff0c;定義如下&#xff1a; #define JNI_FALSE 0 #define JNI_TRUE 1 jsize 整數類型用于描述…

邏輯回歸與決策邊界解析

目錄 前言1 邏輯回歸基礎1.1 Sigmoid函數&#xff1a;打開分類之門1.2 決策函數&#xff1a;劃定分類界限1.3 邏輯回歸詳解 2 決策邊界2.1 線性決策邊界2.2 非線性決策邊界2.3 決策邊界的優化 3 應用與實例3.1 垃圾郵件分類&#xff1a;精準過濾3.2 金融欺詐檢測&#xff1a;保…

.idea文件詳解

.idea文件的作用&#xff1a; .idea文件夾是存儲IntelliJ IDEA項目的配置信息&#xff0c;主要內容有IntelliJ IDEA項目本身的一些編譯配置、文件編碼信息、jar包的數據源和相關的插件配置信息。一般用git做版本控制的時候會把.idea文件夾排除&#xff0c;因為這個文件下保存的…

Java實戰:Spring Boot中實現熱搜與不雅文字過濾功能

引言 在當今互聯網產品中&#xff0c;搜索引擎的熱搜功能和內容過濾機制是提升用戶體驗、維護社區秩序的關鍵要素。本文將探討如何在Spring Boot項目中實現熱搜詞追蹤與不雅文字過濾&#xff0c;并通過具體的代碼示例&#xff0c;帶領我們深入了解其實現原理與步驟。 一、實現…

續Java的執行語句--學習JavaEE的day06

day06 一、for循環嵌套 需求1&#xff1a;打印以下圖形************for(int i 0;i<3;i){//控制行數for(int j 0;j<4;j){//控制列數System.out.print("*");}System.out.println();//換行}需求2&#xff1a;打印以下圖形* i0** i1*** i2**** i3***** i4for…

ISO_IEC_18598-2016自動化基礎設施管理(AIM)系統國際標準解讀(一)

██ ISO_IEC_18598-2016是什么標準&#xff1f; ISO/IEC 18598國際標準是由ISO&#xff08;國際標準化組織&#xff09;/IEC&#xff08;國際電工委員會&#xff09;聯合技術委員會1-信息技術的第25分委員會-信息技術設備互連小組制定的關于信息基礎設施自動化管理的國際標準&…

【AI Agent系列】【MetaGPT多智能體學習】6. 多智能體實戰 - 基于MetaGPT實現游戲【你說我猜】(附完整代碼)

本系列文章跟隨《MetaGPT多智能體課程》&#xff08;https://github.com/datawhalechina/hugging-multi-agent&#xff09;&#xff0c;深入理解并實踐多智能體系統的開發。 本文為該課程的第四章&#xff08;多智能體開發&#xff09;的第四篇筆記。今天我們來完成第四章的作…

java垃圾回收

垃圾回收 一個對象如果不再使用&#xff0c;需要手動釋放&#xff0c;否則就會出現內存泄漏。我們稱這種釋放對象的過程為垃圾回收&#xff0c;而需要程序員編寫代碼進行回收的方式為手動回收。 內存泄漏指的是不再使用的對象在系統中未被回收&#xff0c;內存泄漏的積累可能…

美國經濟政策轉向標記之一

美聯儲沃勒在紐約舉行的 2024 年美國貨幣政策論壇上表示&#xff0c;他希望看到美聯儲投資組合出現兩項關鍵進展&#xff1a; 首先&#xff0c;我希望看到美聯儲的機構MBS持有量降至零。其次&#xff0c;我希望美聯儲轉向增加短期美國國債在持有資產中的占比。在金融危機之前&a…

【ArcGIS Pro二次開發】(83):ProWindow和WPF的一些技巧

在ArcGIS Pro二次開發中&#xff0c;SDK提供了一種工具界面【ArcGIS Pro ProWindow】。 關于ProWindow的用法&#xff0c;之前寫過一篇基礎的教程&#xff1a; 【ArcGIS Pro二次開發】(13)&#xff1a;ProWindow的用法_arcgispro二次開發教程-CSDN博客 主要是對幾個常用控件…

異步編程實戰之webflux

一, 快速搭建webflux項目 1, 引入相關依賴 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.6.5</version><relativePath/> <!-- lookup parent fr…

【嵌入式實踐】【芝麻】【設計篇-2】從0到1給電動車添加指紋鎖:項目可行性分析

0. 前言 該項目是基于stm32F103和指紋模塊做了一個通過指紋鎖控制電動車的小工具。支持添加指紋、刪除指紋&#xff0c;電動車進入P檔等待時計時&#xff0c;計時超過5min則自動鎖車&#xff0c;計時過程中按剎車可中斷P檔狀態&#xff0c;同時中斷鎖車計時。改項目我稱之為“芝…

EMR StarRocks實戰——猿輔導的OLAP演進之路

目錄 一、數據需求產生 二、OLAP選型 2.1 需求 2.2 調研 2.3 對比 三、StarRocks的優勢 四、業務場景和技術方案 4.1 整體的數據架構 4.2 BI自助/報表/多維分析 4.3 實時事件分析 4.5 直播教室引擎性能監控 4.4 B端業務后臺—斑馬 4.5 學校端數據產品—飛象星球 4…

Ajax(黑馬學習筆記)

Ajax介紹 Ajax概述 我們前端頁面中的數據&#xff0c;如下圖所示的表格中的學生信息&#xff0c;應該來自于后臺&#xff0c;那么我們的后臺和前端是互不影響的2個程序&#xff0c;那么我們前端應該如何從后臺獲取數據呢&#xff1f;因為是2個程序&#xff0c;所以必須涉及到…