一、系統定義與技術架構
1.1 系統定義
本系統是基于 Python 開發的電商數據采集與分析工具,旨在通過模擬用戶行為實現淘寶平臺 50 系列顯卡(以 RTX 5060 Ti 為例)銷售數據的自動化獲取、清洗、分析及可視化。核心功能包括:
- 自動登錄:通過 Selenium 模擬瀏覽器操作完成賬號驗證(含滑塊驗證碼破解)。
- 數據采集:爬取商品標題、價格、銷量、店鋪名稱等核心字段,支持前 21 頁分頁爬取。
- 反爬防護:集成代理池、請求頭隨機化、動態休眠等策略規避平臺反爬機制。
- 數據處理:實現數據清洗、去重、統計分析及詞云可視化。