「爬蟲職海錄」三鎮爬蟲

HI,朋友們好

「爬蟲職海錄」第三期更新啦!

本欄目的內容方向會以爬蟲相關的“崗位分析”“職場訪談”為主,方便大家了解一下當下的市場行情。

本欄目持續更新,暫定收集國內主要城市爬蟲崗位相關招聘信息,有求職和跳槽打算的小伙伴們,可以多多關注。

本期為武漢篇

新年伊始,傳說中找工作、換工作的“金三銀四”馬上就要到了。

這次我也從招聘網站找來了200+份當前武漢的爬蟲崗位JD,整理了數據并做了一定的分析。

目前在武漢或者以后打算在武漢發展的小伙伴可要搬好小板凳仔細看啦!

盡管武漢不在一線城市之列,但作為九省通衢的中部地區城市之首,我還是用北上廣深杭來進行比較。

且武漢在校大學生近170W,居全國第一,每年都會產生大量的畢業生。

而這么多的畢業生,尤其是計算機專業,對爬蟲崗感興趣或者是打算從事爬蟲崗的同學,是該留在武漢,還是流向發展更好的一線城市呢?

這時候拿武漢來與其他一線城市作比較得出的數據,對同學們就具有一定參考意義了。

(各大城市當前爬蟲工程師崗位收入)

從上邊可以看到,目前武漢的爬蟲工程師們,平均收入為11207元,收入中位數是10500元。

同時我找來了武漢市統計局已公布的官方數據:2022年武漢市城鎮單位在崗職工年平均工資103308元。(2023年數據尚未公布)

也就是月均8609元。假設按5%的年增速來看,那么2023年武漢市城鎮在崗職工的平均月收入大致就是9039元左右。

武漢的爬蟲崗薪資雖然低于北上廣深杭,但畢竟是IT行業,還是跑的贏當地社會平均收入的。

工資較低的同時,生活成本也相對較低,這就看大家怎么取舍了。

(各大城市當前爬蟲工程師崗位需求)

但爬蟲崗的崗位數量,確實是遠遠落后。目前BOSS直聘上顯示在招爬蟲崗的公司不過百十家,初中高級的崗位共計也就兩百左右。

所以若是想找到一份在薪資待遇、職業發展、通勤時間、工作強度各方面都符合自己要求的爬蟲工作,還是比較不容易的!

下邊我們再看看當下的實際招聘薪資

(廣州當前爬蟲崗位招聘薪資)

招聘信息上掛出的薪酬,月薪大多在5~10K10~15K這兩個區間內,合計占據了全部爬蟲崗的三分之二,這基本也代表了大部分爬蟲工程師在初級崗和中級崗能拿到的薪資收入。

老樣子,K哥在收集招聘信息時,順便為大家整理了一些關鍵詞,包括公司行業、公司規模、崗位title、技能標簽、學歷要求、福利待遇等方面,兄弟們可以瞅瞅。

(武漢爬蟲崗位招聘信息詞云圖)

可以看到,“python”、“20~99人”、“本科”、“帶薪年假”、“爬蟲”、“大專”、“1~3年”這些詞在招聘jd里高頻出現,反映了大部分公司當前的招聘情況。

(這里提醒一下大家,武漢的公司也許加班沒那么多,但雙休和公積金繳納情況,相當堪憂)

K哥銳評—城市&崗位

wu han

崗位情況:★★(2)

武漢的爬蟲崗數量只有北京的1/8,也遠低于其他一線城市,崗位競爭壓力相對較大。

但另一方面,工作經驗在3年內就符合條件的崗位占比達到三分之一,武漢對初級或者剛畢業的爬蟲工程師還算友好。

薪酬水平:★★★(3)

武漢的爬蟲崗工資是高于當地社會平均收入的,雖不及一線城市,但生活成本也相對較低,工作幾年后能夠拿到一份每月過萬的薪水,生活是不至于過的太差的,還能稍有盈余。

城市魅力:★★★(3)

一方面武漢每年都會涌進大量的年輕人,還算是一座比較年輕化的城市。

另一方面武漢具有得天獨厚的地理位置優勢,不管你籍貫何處,回家都不會太遠。

盡管收入和崗位并不占優,但也只是相對幾座一線城市而言,況且并不是所有人能接受一線城市的壓力和“內卷”。

綜合得分:★★★★★★★★(8)

工資水平是選擇城市&崗位的重要標準,但不會是唯一標準。

若你喜歡熱情滾燙的風土人情,大江大湖的地理稟賦,那么武漢也許會適合你!

武漢丨爬蟲崗位

(以下崗位為隨機列舉,信息來源——BOOS直聘)

01 集度

-1000-9999人

-互聯網 AI 汽車

地址|武漢洪山區國采中心T3

Spider工程師

15-25K·16薪

  • 職位詳情:
  • 1.負責爬蟲系統的架構設計與研發,管理分布式爬蟲服務器,開發任務調度引擎;
  • 2.負責指定網頁或APP的定向爬取以及內容的抽取和去重等分析工作
  • 3.負責爬蟲核心算法的策略優化和研究,提升爬蟲抓取效率和質量
  • 任職要求:
  • 1.熟悉Python/PHP/JavaScript等腳本語言中至少一種;
  • 2.熟悉html/css/xpath等常用的web知識和正則表達式
  • 3.有分布式爬蟲系統的開發、架構經驗,至少熟悉并使用過一種主流的爬蟲架構,如Scrapy、Gocolly、Webmagic等優先;
  • 4.熟悉Linux系統環境和Mysql、Redis、MongoDB等數據庫。
  • 其他:
  • 上午09:30 - 下午06:30
  • 雙休、彈性工作

02 超越芯科技

-100~499人

-電子/半導體/集成電路

地址|武漢洪山區銘豐大廈1510

python爬蟲開發工程師

11-18K·13薪

  • 職位詳情:
  • 1.負責相關網站、論壇、app的爬蟲設計和開發,以及策略持續優化;
  • 2.分析項目的可行性和數據采集方案,負責核心算法的策略優化研究,充分利用資源,避免限制;
  • 3.參與開發數據采集程序,對目標站點/app進行結構化和非結構化數據數據分析,并對數據抓取,對各種目標數據進行信息提取、清洗、去重、整理及優化;
  • 4.不斷完善數據采集框架,對框架進行優化和改進;
  • 5.參與數據分析處理流程、數據分析匯總報告的設計與開發;
  • 6.優化和管理入庫的數據。
  • 任職要求:
  • 1.專科及以上學歷,計算機軟件或相關專業,3年及以上python開發經驗;
  • 2.掌握爬取的各類實現方式和技術細節,包括不限于:熟悉常見的反爬策略、掌握網絡協議分析(http1.1/http2等)、有JavaScript反爬/逆向(AST)、APP反爬/逆向等;
  • 3.掌握tls指紋ja3,能夠對抗akamai,PerimeterX,cloudflare風控優先;
  • 4.掌握網絡爬蟲開發原理,熟悉互聯網各種類型數據交互模式,熟悉TCP/IP、HTTP、HTTPS等網絡協議,熟悉web前端;
  • 5.熟悉使用python主流爬蟲框架,有分布式爬蟲經驗;
  • 6.熟練掌握正則表達式、XPath等信息抽取技術;
  • 7.熟悉Redis、Mysql、MongoDB等常用的數據庫;
  • 8.具有較強的分析和解決問題的能力;
  • 9.具備良好的溝通能力和團隊協作能力。
  • 其他:
  • 上午09:30 - 下午06:30
  • 雙休、不加班

03 樂薇

-100-499人

-互聯網 電商

地址|武漢江夏區東港科技產業園2號樓3樓

Python爬蟲工程師

10-15K·13薪

  • 職位詳情:
  • 1.參與公司爬蟲系統的架構設計和開發;
  • 2.監控和優化爬蟲系統,提升性能和增強功能;
  • 3.帶領團隊負責多平臺信息抓取和大數據倉庫維護;
  • 4.解決實際工作中遇到的各種疑難雜癥。
  • 任職要求:
  • 1.統招本科及以上學歷;
  • 2.3年以上Python爬蟲經驗;
  • 3.熟悉多線程、反爬蟲、驗證碼識并精通網頁抓取原理及技術,熟練使用正則表達式、csspath、xpath等獲取信息;
  • 4.精通任一開源爬蟲框架,如Scrapy、Nutch、DotnetSpider等;
  • 5.熟悉掌握Mysql,Mongodb,Redis等常用數據庫;
  • 6.有海量主流電商平臺數據爬取經驗者優先,能迅速響應電商平臺變動做規則調整。
  • 其他:
  • 8小時工作制,周末雙休,無強制加班
  • 五險一金,集體旅游

04 積善科技

-20~99人

-互聯網

地址|武漢洪山區國際企業中心

python爬蟲開發工程師

8-13K·13薪

  • 職位詳情:
  • 1. 負責分布式爬蟲和數據采集系統開發;
  • 2. 分析客戶的爬蟲場景,幫助客戶提升爬蟲成功率;
  • 3. 對爬蟲相關技術進行探索與應用:如js渲染抓取,反爬攻破等;
  • 4. 參與公司業務平臺的數據的挖掘和分析,協助進行客戶畫像和產品改進。
  • 任職要求:
  • 1. 計算機專業本科及以上學歷,不低于兩年的開發經驗;
  • 2. 熟練掌握Python,能使用django/Flask等常用框架進行項目開發;
  • 3. 熟悉 Web 界面結構分析方法,能夠從結構化和非結構化的數據中獲取指定信息;
  • 3. 熟悉TCP/IP、HTTP 等網絡協議,熟悉 Linux 平臺上的開發,熟練掌握 Python;
  • 4. 熟悉 JS 加密逆向、驗證碼識別、代碼混淆還原、Hook 等常見爬蟲技術;
  • 5. 有安卓逆向、反編譯、TLS 指紋、瀏覽器指紋相關經驗優先;
  • 6. 有博客、github、csdn、知乎等展示代碼和技術的優先考慮;
  • 7. 有驗證碼識別、逆向處理經驗優先;
  • 8. 自我驅動,責任心強,執行力強,善于學習,能挑戰自我不斷追求卓越;
  • 其他:
  • 上午09:00 - 下午06:30 彈性工作時間

05 七樞星科技

-20-99人

-計算機軟件

地址|武漢武昌區萬達尊B座704

爬蟲工程師

20-35K·13薪

  • 職位詳情:
  • 1.與爬蟲系統的架構設計、核心模塊(抓取調度,頁面解析和結構化抽取,海量數據存儲和讀取等)開發,改進和提升爬蟲效率;
  • 2.攻破各種反爬策略,快速解決各類技術疑難問題,建設反爬對抗組件庫;
  • 3.完善爬蟲的技術指標體系,并基于指標迭代優化爬蟲基礎能力,指標體系中,全面性指標的建立,基于隨機采樣,估計系統總體目標信息;
  • 4.技術難題攻關,解決實際開發過程碰到的各類問題。
  • 任職要求:
  • 1.計算機相關專業,本科以上學歷;
  • 2.熟練掌握Python、Webdriver;
  • 3.有反反爬蟲、解決無感驗證碼的經驗;
  • 4.解決過akamai、recaptcha等國內外知名的機器人防護框架的經驗。
  • 其他:
  • 8:30-18:00(彈性十分鐘)
  • 五險一金、全勤獎

06 湖北航信

-500-999人

-信息安全

地址|武漢市東西湖區網安大廈A座18樓

爬蟲實習生

2-3K

  • 職位詳情:
  • 1.熟悉爬蟲原理,精通WebDriver、Selenium、requests
  • 2.熟悉html、dom、xpath、正則表達式等常見的數據抽取技術
  • 3.熟悉常見反爬措施
  • 4.熟悉Python等數據處理模塊例如pandas,numpy等
  • 5.熟練使用MySQL、 MongDB或其他數據庫
  • 6.熟練使用python進行項目開發,有良好的編碼習慣
  • 7.良好的邏輯思維能力和溝通能力,善于分析問題/解決問題

ps:

1,文中出現的崗位JD,包括薪酬,工作時間、福利等情況,均為招聘單位公示,我只是做了收集,實際情況大家可以主動聯系招聘方進行咨詢。

2,文中出現的崗位基本為隨機選取,只作為參考,并不代表K哥推薦,我并未收取任何單位以及個人的廣告費,也不提供簡歷投遞渠道。

3,文中出現的招聘信息截至發文,仍為在招狀態,后期K哥不對相關信息的有效性負責。

4,關于爬蟲&職場方面的內容,大家還希望看到哪些呢,歡迎多多向我提建議,也歡迎小伙伴們在評論區積極“吐槽”自己目前的公司。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715564.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715564.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715564.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【高級數據結構】Trie樹

原理 介紹 高效地存儲和查詢字符串的數據結構。所以其重點在于:存儲、查詢兩個操作。 存儲操作 示例和圖片來自:https://blog.csdn.net/qq_42024195/article/details/88364485 假設有這么幾個字符串:b,abc,abd&…

Vue中如何實現條件渲染?

在Vue中實現條件渲染非常簡單且靈活&#xff0c;主要通過Vue的指令來實現。在Vue中&#xff0c;我們可以使用v-if和v-else指令來根據條件來渲染不同的內容。下面就讓我們通過一個簡單的示例來演示如何在Vue中實現條件渲染&#xff1a; <!DOCTYPE html> <html lang&qu…

GO泛型相關

通過引入 類型形參 和 類型實參 這兩個概念&#xff0c;我們讓一個函數獲得了處理多種不同類型數據的能力&#xff0c;這種編程方式被稱為 泛型編程。 2. Go的泛型 類型形參 (Type parameter)類型實參(Type argument)類型形參列表( Type parameter list)類型約束(Type constr…

Pake 輕松構建輕量級多端桌面應用

Pake 利用 Rust 輕松構建輕量級多端桌面應用&#xff0c;支持 Mac / Windows / Linux。 小白用戶&#xff1a;可以使用 「常用包下載」 方式來體驗 Pake 的能力&#xff0c;也可試試 Action 方式。 開發用戶&#xff1a;可以使用 「命令行一鍵打包」&#xff0c;對 Mac 比較友…

Matlab 機器人工具箱 動力學

文章目錄 R.dynR.fdynR.accelR.rneR.gravloadR.inertiaR.coriolisR.payload官網:Robotics Toolbox - Peter Corke R.dyn 查看動力學參數 mdl_puma560; p560.dyn;%查看puma560機械臂所有連桿的動力學參數 p560.dyn(2);%查看puma560機械臂第二連桿的動力學參數 p560.links(2)…

react父子組件傳參demo

父組件代碼 /* eslint-disable next/next/no-img-element */ "use client"; import React, { useEffect, useState } from "react"; import WxTip from ../components/WxTipconst Download () > {const [showTip, setshowTip] useState<boolean…

javaweb day9 day10

昨天序號標錯了 vue的組件庫Elent 快速入門 寫法 常見組件 復制粘貼 打包部署

高斯消元法解線性方程組

高斯消元法 基本性質&#xff1a; 把某一行乘一個非 0 0 0的數 (方程的兩邊同時乘上一個非 0 0 0數不改變方程的解) 交換某兩行 (交換兩個方程的位置) 把某行的若干倍加到另一行上去 &#xff08;把一個方程的若干倍加到另一個方程上去&#xff09; 算法步驟 枚舉每一列c …

洛谷p1225 c++(使用高精度)

題解: 一開始我這個代碼想到的是使用遞歸來求解 int digui(int n){int sum=0;if(n==1)sum=1;if(n==2)sum=2;if(n==1||n==2)return sum;if(n>2){return sum+=digui(n-1)+digui(n-2);} } 但是后面發現明顯超時,我試圖用記憶化搜索來搶救一下,所以就有了下面代碼 int di…

圖論 - DFS深度優先遍歷、BFS廣度優先遍歷、拓撲排序

文章目錄 前言Part 1&#xff1a;DFS&#xff08;深度優先遍歷&#xff09;一、排列數字1.題目描述輸入格式輸出格式數據范圍輸入樣例輸出樣例 2.算法 二、n皇后問題1.問題描述輸入格式輸出格式數據范圍輸入樣例輸出樣例 2.算法 三、樹的重心1.問題描述輸入格式輸出格式數據范圍…

計算機二級Python刷題筆記------基本操作題23、33、35、37(考察字符串)

文章目錄 第二十三題&#xff08;字符串替換&#xff1a;replace(old,new)&#xff09;第三十三題&#xff08;字符串遍歷&#xff09;第三十五題&#xff08;字符串與列表&#xff09;第三十七題&#xff08;拼接字符串&#xff09; 第二十三題&#xff08;字符串替換&#xf…

第19章-IPv6基礎

1. IPv4的缺陷 2. IPv6的優勢 3. 地址格式 3.1 格式 3.2 長度 4. 地址書寫壓縮 4.1 段內前導0壓縮 4.2 全0段壓縮 4.3 例子1 4.4 例子 5. 網段劃分 5.1 前綴 5.2 接口標識符 5.3 前綴長度 5.4 地址規模分類 6. 地址分類 6.1 單播地址 6.2 組播地址 6.3 任播地址 6.4 例子 …

Redis學習------實戰篇----2024/02/29----緩存穿透,雪崩,擊穿

1.緩存穿透 Overridepublic Result queryById(Long id) {//1.從redis中查詢緩存String key CACHE_SHOP_KEY id;String shopJson stringRedisTemplate.opsForValue().get(key);//2.判斷是否存在//3.存在則直接返回if (StrUtil.isNotBlank(shopJson)){Shop shop JSONUtil.toB…

每日一題 2867統計樹中的合法路徑

2867. 統計樹中的合法路徑數目 題目描述&#xff1a; 給你一棵 n 個節點的無向樹&#xff0c;節點編號為 1 到 n 。給你一個整數 n 和一個長度為 n - 1 的二維整數數組 edges &#xff0c;其中 edges[i] [ui, vi] 表示節點 ui 和 vi 在樹中有一條邊。 請你返回樹中的 合法路…

Nginx 反向代理入門教程

Nginx 反向代理入門教程 一、什么是反向代理 反向代理&#xff08;Reverse Proxy&#xff09;方式是指以代理服務器來接受Internet上的連接請求&#xff0c;然后將請求轉發給內部網絡上的服務器&#xff1b;并將從服務器上得到的結果返回給Internet上請求連接的客戶端&#x…

Vue 2.0 與 Vue 3.0 的主要差異

Vue 2.0 與 Vue 3.0 的主要差異 在前端框架的世界中&#xff0c;Vue.js 已經成為了一股不可忽視的力量。自從 Vue.js 首次亮相以來&#xff0c;它便以其輕量級、靈活性和易用性贏得了開發者的喜愛。然而&#xff0c;隨著技術的不斷進步和開發者需求的不斷變化&#xff0c;Vue.…

Android AppCompatActivity 方法詳解

在 Android 開發中&#xff0c;AppCompatActivity 是一個常用的類&#xff0c;它提供了對新版 Android 特性在舊版 Android 上的兼容支持。作為 Android 支持庫的一部分&#xff0c;它通常被用作活動&#xff08;Activity&#xff09;的基類。下面我們將介紹 AppCompatActivity…

Vins-Moon配準運行

Vins-Moon運行 源碼地址電腦配置環境配置編譯適配Kitti數據集運行結果Euroc數據集kitti數據集 evo評估&#xff08;KITTI數據&#xff09;輸出軌跡(tum格式)結果 源碼地址 源碼鏈接&#xff1a;https://github.com/HKUST-Aerial-Robotics/VINS-Mono.git 電腦配置 Ubuntu 18.…

破解SQL Server迷局,徹底解決“管道的另一端無任何進程錯誤233”

問題描述&#xff1a;在使用 SQL Server 2014的時候&#xff0c;想用 SQL Server 身份方式登錄 SQL Servcer Manager&#xff0c;結果報錯&#xff1a; 此錯誤消息&#xff1a;表示SQL Server未偵聽共享內存或命名管道協議。 問題原因&#xff1a;此問題的原因有多種可能 管道…

人才測評系統在企業中的作用有哪些?

一個企業除了產出價值給社會&#xff0c;它還有自己的工作架構體系&#xff0c;無論的工作時間制度上&#xff0c;還是工資組成方向&#xff0c;這樣公司才能正常運轉&#xff0c;那么人才測評系統可以在企業中充當一個什么角色呢&#xff1f;又或者說它起著什么作用呢&#xf…