今天,馬云爸爸又來貢獻金句了,比王健林公公一億一個小目標還高,“一個月掙一二十個億很難受!!!”,作為在傳統企業主要為電商部門提供數據分析的數據分析師,體驗太深刻了。
雙11前后,電商部門的數據需求越來越多,數據采集、數據支持、數據分析各方面都有,從大領導、部門領導、電商小組成員都有。直接原因是雙11復盤,需要先看數據。根本原因是免費流量越來越少,而且越來越分散,你都不知道為什么少,從哪里少;付費流量ROI 越來越高;又有消費升級的問題,直言現在的消費者我們看不懂啊看不懂。
變化的流量,到底漲在哪里,跌在哪里? 轉化到底哪家高?原有打法不出糧食了,領導外出學習,發現大家都這樣,這不錢都給馬云爸爸賺去了,爸爸能不難受嗎???
但想要知道淘系、京東上公司產品流量的來源與去向,是件更難受的事情。因為阿里、京東根本不開放這些數據給你,開放天貓有生意參謀這個數據產品,都推出第三代了。京東……就不說了。
大家看到我都說這么多了,跟我們今天的標題好像沒有任何關系?但現在開始就有關系了,如何通過天貓提供的生意參謀工具進行店鋪的流量分析,以下就是列出來的淘系的流量來源明細分類。
然后我就拿到了。
這樣同一類型,但是行數不統一的多達130個文檔。而且文檔里面還長成這樣:
這個光那個處理數據就要花一番功夫了,但是只要使用上Python 中操作EXCEL表格的包,只要不到100行代碼,將其處理成結構化數據,并干干凈凈存到數據庫中只要三分鐘。是那些包呢。
以下:
os
pandas
xlrd
glob
numpy
datetime
pymysql
xlwt