30歲的年齡;這個年齡大家都是成年人;都是做父母的年齡了;你再工位上的心態會發生很大變化的;
爬蟲工程師基本都是如此;社會最low的一幫連銷售都做不了的;單子都開不出來的然后轉行做爬蟲工程師的;這樣的人基本不太和社會接觸;
你作為爬蟲初級工程師就敲著鍵盤然后解析著html;然后把需求的字段取出來這有什么意義;
為了爬蟲能上線然后反復測試爬蟲;看爬的數據是否和網頁一致;這有什么意義;
然后爬蟲某個解析報錯了;某個取值報錯了你重新修補下提交;這有什么意義;
然后要讓你買賬號;要讓你申請賬號;讓你測ip;讓你找商家然后列在表格里;這有什么意義;
然后一個渠道涉及很多爬蟲變得臃腫以后;要你把模塊變得通用化;能合并的合并起來;能復用的復用;重新大刀闊斧的結構優化;幫你找活干;這有什么意義;
然后他給你一個調用的服務接口模板;然后讓你一遍一遍修改讓測試很多遍;他挑出各種毛病;最后滿足他心里規范的可以他調用的適配他的接口腳本;這有什么意義;
然后出現反爬以后你為了測試cookies什么時候過期;ip是否會被封禁;是否有瀏覽器指紋的驗證;簽名參數是否異常;請求頻率的瓶頸;請求的效率瓶頸一頓測試網站的風控機制;這有什么意義;
然后網站接口改版了;返回的是臟數據了;返回的接口字段提取異常了;接口不可用了;你又得找新接口;你又得重新變著花樣的用各種方式解析html解析dom解析xml解析csv解析json;你又得反復測試接口;這有什么意義;
然后爬蟲leader給你一個腳本任務需求;你還得盡善盡美;揣摩他的期望需求;寫出很規范的測試腳本開發腳本;測試很多遍以后沒有問題再誠惶誠恐的交給他;這有什么意義;
你還得按照這家公司的業務;他定義好的爬蟲模板來寫爬蟲;再這個爬蟲模板里面調用寫好的中間件;ip池;cookies池;logstash日志;item管道;存儲讀取展示測試數據然后開發爬蟲;這有什么意義
然后日志寫在哪里;數據如何去重;接口多少翻頁停止;爬蟲重試多少次數;數據返回哪些字段;你的大多數工作就是這個既定的模板里面按照爬蟲leader給你的業務規范機械性的填代碼;這有什么意義;