linux chrome 安裝過程記錄

最近,由于公司需要做爬蟲抓取一些新聞,在開發過程中,發現有些網站有一定的反爬措施,通過瀏覽器訪問一切正常,通過其他方式,包括:curl,urlconnection 等,就算加入了cookie,agent等參數也不能完全正常訪問,導致爬取失敗。

經過網上查找資料,找到解決方案,

對于這種特殊的網站,爬取方式改為通過程序在服務器端打開瀏覽器,訪問地址,然后解析入庫。

過程中需要用到chrome瀏覽器和chromedriver來實現

其中,chrome瀏覽器支持無界面訪問網站,chromedriver,提供java,python,php等語言調用chrome的能力。

現將安裝過程記錄如下(基于centos6.5,centos7.2 親測成功):

一、安裝chrome

1. 下載安裝腳本,

在下載目錄中,執行以下命令,將安裝腳本下載到本地

wget https://intoli.com/install-google-chrome.sh

2.然后授予可執行權限

chmod 755 ./install-google-chrome.sh

3.執行腳本

./install-google-chrome.sh

安裝腳本會自動下載、安裝chrome(合適的版本),并且目前兩個系統中,所缺少的依賴,都會被安裝。

4.測試安裝結果

執行命令,? google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot https://www.baidu.com/

如果在當前文件夾中出現screenshot.png? 則安裝成功

二、安裝chromedriver

1.切換到 chrome安裝路徑 (個人習慣,實際上在什么目錄都可以)

cd /opt/google/

2.下載文件包

wget https://npm.taobao.org/mirrors/chromedriver/75.0.3770.90/chromedriver_linux64.zip

3.解壓文件包

unzip chromedriver_linux64.zip

解壓后,在/opt/google/ 會多出一個文件chromedriver

4.連接文件

ln -s /opt/google/chromedriver /usr/bin/chromedriver

?

?

執行以上命令后,安裝成功

?如果文件下載失敗,可以下載傳上服務器

地址是

https://files.cnblogs.com/files/suntray/install-google-chrome.sh.zip? ?(安裝腳本)

https://files.cnblogs.com/files/suntray/chromedriver_linux64.zip? ? ? ? ? (驅動文件)

轉載于:https://www.cnblogs.com/suntray/p/11136363.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/248601.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/248601.shtml
英文地址,請注明出處:http://en.pswp.cn/news/248601.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

系統帶你學習 WebAPIs 第五講

Web APIs 本篇學習目標: 能夠說出常見 offset 系列屬性的作用 能夠說出常見 client 系列屬性的作用 能夠說出常見 scroll 系列屬性的作用 能夠封裝簡單動畫函數 **1.1. **元素偏移量 offset 系列 1.1.1 offset 概述 offset 翻譯過來就是偏移量, 我們使用 offset系…

ajax請求相關問題

Ajax中async:false/true的作用: async. 默認是 true,即為異步方式,$.ajax執行后,會繼續執行ajax后面的腳本,直到服務器端返回數據后,觸發$.ajax里的success方法,這時候執行的是兩個線程。 async…

有贊美業微前端的落地總結

2020年4月,有贊美業的前端團隊歷經7個月時間,完成了美業PC架構從單體SPA到微前端架構的設計、遷移工作。PPT在去年6月份就有了,現在再整理一下形成文章分享給大家。 頭圖 目錄 Part 01 “大話”微前端 微前端是什么 背景 目標 達成價值 …

bcp文件, 逗號文件

bcp 實用工具 https://docs.microsoft.com/zh-cn/sql/tools/bcp-utility?viewsql-server-2017 大容量復制程序實用工具 (bcp) 可以在 Microsoft SQL Server 實例和用戶指定格式的數據文件間大容量復制數據。 使用 bcp 實用工具可以將大量新行導入 SQL Server 表,或…

遠程登錄和復制文件

命令: ssh 對應英文: secure shell 使用: ssh [-P] 用戶名ip 優點: 加密和壓縮,即安全和提高傳輸速度 注意: 除了windows系統外的系統默認有ssh客戶端,直接使用命令便可; windows系統…

Markdown 編輯器才是yyds|CSDN編輯器測評

前言 今天小編為大家介紹一款編輯器,也正是小編書寫這篇文章所使用的Markdown編輯器,正是廣大博友想要發布文章的工具。那么 你知道他的都有哪些方便之處么 下面小編帶你了解一下 Markdown是什么 Markdown是一種輕量標記語言,通過簡單的語法&#xff…

JVM對象已死

(一) 引用計數法 每有一個引用就加1,每失效一個就減1,為0表示可回收;但是此方法無法解決相互引用的情況 (二) 根搜索算法 從一系列的GCRoots對象為起點向下搜索,搜索的路徑稱為引用鏈,當一個對象沒有任何引…

pcl和opencv多版本共存

pcl和opencv多版本共存 在Ubuntu 16.04系統下安裝kinetic版本ROS, 會默認安裝opencv 3.3.1和pcl1.7. opencv安裝路徑/opt/ros/kinetic/ pcl安裝路徑/usr/ 如果想安裝opencv2.4版本,或者安裝pcl 1.8版本,那么如何設置安裝路徑,同時…

45天帶你玩轉Node(第三天)Node環境安裝

本篇目標 能夠搭建 Node 運行環境掌握 NodeJS 程序的運行方法理解模塊化開發理解系統模塊和第三方模塊理解package.json文件作用 1.Node 開發概述 1.1為什么要學習服務器端開發技術 前端人員為什么要學習服務器端開發技術? 能夠和后端程序員更加緊密的配合網站…

給頁面加速,干掉Dom Level 0 Event

現在的web應用越來越復雜,需要響應各種各樣的用戶觸發事件,因而也就不可避免的,需要給我們的html頁面上的dom元素增加事件監聽函數. 我們知道給dom元素綁定事件監聽函數的方法有如下3種: 1 : 頁面html: <button onclick”test();”></button>2: 頁面html: <bu…

系統帶你學習 WebAPIs —— 動畫篇(第六講)

Web APIs 本篇學習目標: 能夠封裝簡單動畫函數 能夠理解緩動動畫的封裝 能夠使用動畫函數 能夠寫出網頁輪播圖案例 能夠寫出移動端觸屏事件 1.1. 動畫函數封裝 1.1.1 緩動效果原理 緩動動畫就是讓元素運動速度有所變化&#xff0c;最常見的是讓速度慢慢停下來 思路&#xff…

Git使用教程:最詳細、最傻瓜、最淺顯、真正手把手教!(轉載學習)

一&#xff1a;Git是什么&#xff1f; Git是目前世界上最先進的分布式版本控制系統。 二&#xff1a;SVN與Git的最主要的區別&#xff1f; SVN是集中式版本控制系統&#xff0c;版本庫是集中放在中央服務器的&#xff0c;而干活的時候&#xff0c;用的都是自己的電腦&#xff0…

有些話別不當回事

1、別跟墮落的人比墮落。墮落起來非常容易&#xff0c;可是墮落后再想回到不墮落&#xff0c;難。不要給自己頹廢的機會。 2、不要以為躲在學校里就可以忽略外面世界的殘酷現實。競爭越來越激烈&#xff1a;人越來越多&#xff0c;職位卻越來越少。學校里固然溫柔&#xff0c;但…

看完這篇文章保你面試穩操勝券——Vue篇

? 進大廠收藏這一系列就夠了,全方位搜集總結,為大家歸納出這篇面試寶典,面試途中祝你一臂之力!,共分為四個系列 ? 本 篇 為 《 看 完 這 篇 文 章 保 你 面 試 穩 操 勝 券 》 第 一 篇 ( V

梯度下降更新算法

梯度更新是要同時更新&#xff0c;如下圖所示&#xff1a;θ0和θ1同時更新&#xff0c;而不是更新完一個后再更新另一個。 學習率α過小&#xff0c;梯度下降較慢&#xff0c;訓練時間增長。若學習率α過大&#xff0c;梯度下降會越過最低點&#xff0c;難以得到最優的結果&am…

MangoFix:iOS熱修復另辟蹊徑

今天向大家介紹的是iOS熱修復的另一解決方案&#xff1a;MangoFix。介紹他的原因是他和傳統的iOS熱修復使用JavaScript bridge 的方式完全不同&#xff0c;MangoFix是一個語法和OC語法非常類似的DSL&#xff0c;其語言本身的設計目標就是為了解決iOS熱修復問題&#xff0c;所以…

看完這篇文章保你面試穩操勝券——基礎篇(html/css)

? 進大廠收藏這一系列就夠了,全方位搜集總結,為大家歸納出這篇面試寶典,面試途中祝你一臂之力!,共分為四個系列 ? 本 篇 為 《 看 完 這 篇 文 章 保 你 面 試 穩 操 勝 券 》 第 二 篇 ( h

《深入理解Spark-核心思想與源碼分析》(四)第四章存儲體系

天行健&#xff0c;君子以自強不息&#xff1b;地勢坤&#xff0c;君子以厚德載物。——《易經》 本章導讀 Spark的初始化階段、任務提交階段、執行階段&#xff0c;始終離不開存儲體系。 Spark為了避免Hadoop讀寫磁盤的I/O操作成為性能瓶頸&#xff0c;優先將配置信息、計算結…

看完這篇文章保你面試穩操勝券 ——(必考題)javaScript 篇

? 進大廠收藏這一系列就夠了,全方位搜集總結,為大家歸納出這篇面試寶典,面試途中祝你一臂之力!,共分為四個系列 ? 本 篇 為 《 看 完 這 篇 文 章 保 你 面 試 穩 操 勝 券 》 第 三 篇 ( j

Django打造大型企業官網-項目部署

Django打造大型企業官網-項目部署 一、準備工作 1、在開發機上的準備工作 1&#xff09;確認項目沒有bug。 2&#xff09;打開終端&#xff0c;進入虛擬環境&#xff0c;再 cd 到項目根目錄下&#xff0c;執行命令&#xff1a;pip freeze > requirements.txt&#xff0c;將…