王明 | 高級數據挖掘工程師 | 5年經驗
📱
(+86) 189-xxxx-xxxx | 📧
wangming@email.com | 📍
深圳市
💻
GitHub | 👔
LinkedIn
💼 工作經歷
?科技前沿集團 | 高級數據挖掘工程師
📅
2021.06 - 至今
核心貢獻:
- 主導建立公司AI中臺,整合10+業務線數據資源,支撐日均5億+數據處理
- 研發自適應特征工程框架,特征生成效率提升3倍,減少人工特征工程工作量70%
- 設計模型健康監測系統,關鍵業務模型異常響應時間縮短至<15分鐘
?智能未來科技 | 數據挖掘工程師
📅
2018.09 - 2021.05
核心貢獻:
- 構建電商實時推薦系統,CTR提升25%,年度GMV增長¥2800萬
- 開發用戶流失預警模型,準確率92%,年挽留高價值用戶38,000+
- 搭建AB測試平臺,支持全公司200+團隊實驗需求,決策效率提升60%
🚀 核心項目經歷
金融風控智能決策系統 | 技術負責人
🔧
Python/Scala/XGBoost/Spark/Flink/Graph Neural Networks
📅
2022.03 - 2023.01
業務挑戰:傳統風控模型覆蓋不全,壞賬率持續攀升
解決方案:
- 融合交易、行為、關系網絡數據構建三層防御體系
- 創新應用時間滑動窗口特征提取算法,捕捉動態風險模式
- 開發基于異構圖的關聯風險挖掘模塊,識別團伙欺詐
技術成果:
?? KS值0.46,壞賬率降低32%
?? 日均處理60萬+請求,自動化審批率提升至85%
?? 年節約風控成本¥3000萬+,獲公司年度最佳項目獎
醫療AI影像診斷平臺 | 算法負責人
🔧
PyTorch/TensorRT/Docker/Kubernetes/Medical Image Processing
📅
2021.08 - 2022.09
業務挑戰:醫療影像診斷效率低,三甲醫院平均閱片時間>20分鐘
解決方案:
- 設計多尺度特征融合CNN架構,增強微小病灶識別能力
- 開發數據增強流水線,解決醫療數據稀缺問題
- 實現模型蒸餾壓縮技術,推理速度提升5倍
技術成果:
?? 肺部CT結節檢測召回率96.5%,假陽性率降低40%
?? 系統響應時間<3秒,日均處理量1.2萬+影像
?? 在8家三甲醫院應用,診斷效率提升200%
智慧零售需求預測系統 | 核心架構師
🔧
Prophet/LSTM/Transformer/AWS SageMaker/Airflow
📅
2020.03 - 2021.02
業務挑戰:零售商品預測準確率僅65%,庫存周轉效率低下
解決方案:
- 融合多源數據(天氣、促銷、社交媒體)構建時空預測模型
- 開發分層預測框架,實現SKU-門店粒度的精準預測
- 搭建自適應權重調整模塊,應對突發事件影響
技術成果:
?? 預測準確率提升至92%,庫存周轉率提高40%
?? 覆蓋3萬+SKU,減少滯銷損失¥1500萬/年
?? 預測計算時間從小時級縮短至分鐘級
🎓 教育背景
南京大學 | 計算機科學與技術 | 碩士
📅
2015.09 - 2018.06 | GPA 3.7/4.0
東南大學 | 數學與應用數學 | 學士
📅
2011.09 - 2015.06 | GPA 3.6/4.0
🛠? 技術棧
算法建模
? 精通:XGBoost/LightGBM, CNN/Transformer, GNN, 集成學習
? 熟練:概率圖模型, 時間序列分析, 異常檢測, 強化學習
工程架構
? 大數據:Spark(調優專家), Flink, Kafka, Hive
? 云平臺:AWS(SageMaker, EMR), 阿里云(MaxCompute, PAI)
? MLOps:MLflow, Kubeflow, Airflow, Docker/K8s
數據工程
? 特征工程:Feature Store設計, 自動化特征生成
? 模型部署:TensorFlow Serving, ONNX, 模型蒸餾優化
? 可視化:Tableau, Streamlit, Plotly
🏆 專業成就
專利技術
? 多模態數據融合分析系統(專利號:ZL20201012345.6)
? 實時特征計算引擎架構(專利號:ZL20211098765.4)
競賽榮譽
? Kaggle:貸款風險預測金牌(Top 0.8%)、住房估價大賽銀牌(Top 1.2%)
? 天池:醫療AI診斷競賽全國亞軍、電商銷量預測季軍
技術認證
? AWS機器學習專家認證 | Google云數據工程師 | TensorFlow開發者認證
? 自我評價
五年深耕商業智能領域的數據挖掘專家,專注解決高復雜度業務場景中的數據挑戰。核心優勢:
- ?全鏈路能力:從數據探索→算法研發→系統部署的全流程落地經驗
- ?工程化思維:注重方案可擴展性,主導構建3個日均億級處理量的數據系統
- ?業務敏感度:善于將業務需求轉化為技術方案,累計創造商業價值超¥6000萬
- ?技術創新:持有2項專利技術,8次獲得公司級技術突破獎
📌 其他
- ?技術布道:在QCon、AICon等技術大會做主題分享5次
- ?開源貢獻:維護PySpark優化工具集(GitHub 600+ stars)
- ?專業寫作:技術專欄「工業級AI實戰」作者,讀者超3萬人
- ?語言能力:英語流利(TOEIC 950),可全英文技術溝通