姓名 / Your Name
數據挖掘工程師 | 5年經驗 | 推薦/風控/圖模型
📞 138-XXXX-XXXX | ?? your.email@example.com | 🌐 github.com/yourname | 📍 北京
🎯 個人簡介 / Summary
5年大廠數據挖掘經驗,碩士學歷。擅長推薦系統、用戶畫像、圖神經網絡及反欺詐建模,具備扎實的機器學習與工程實踐能力。主導多個線上模型從0到1落地,提升業務核心指標。熟悉數據全流程處理,具備從特征設計到模型部署、AB測試的全鏈條經驗。
💼 工作經歷 / Work Experience
高級數據挖掘工程師
字節跳動 | 推薦技術部門
2021.08 – 現今,北京
- 參與短視頻推薦排序算法設計與優化,主導多任務學習模型(DeepFM + MMoE)上線,點擊率提升12.3%;
- 構建用戶畫像系統,涵蓋靜態屬性、興趣聚類、動態行為標簽,支撐推薦/廣告/風控三大系統;
- 聯合平臺團隊建立特征服務系統,支持日均百億級請求,穩定性達99.99%;
- 跨部門推進 AB 實驗平臺優化,實現AB測試自動分流+指標歸因分析。
數據挖掘工程師
美團 | 風控與調度技術組
2018.07 – 2021.07,北京
- 主導“虛假商戶識別”圖挖掘項目,引入 GAT 圖神經網絡,準確率提升至91%,上線后每月攔截惡意商戶300+;
- 參與騎手調度優化項目,構建包含天氣/訂單/區域熱度等多源特征體系,提升調度模型效率,配送時間下降8.5%;
- 搭建基于 Hive + Airflow 的特征流水線系統,實現建模樣本生成標準化、自動化。
🧪 項目經歷 / Selected Projects
內容推薦排序優化模型(字節跳動)
- 建立基于用戶短期興趣的推薦排序模型,采用 Transformer + DeepFM 架構;
- 通過樣本采樣、重加權緩解曝光偏差,模型效果穩定,AB實驗點擊率提升12%+;
- 推動線上部署,模型影響覆蓋日均用戶超2億。
用戶畫像系統重構(字節跳動)
- 基于用戶行為、社交關系構建圖結構,用 GCN 聚類興趣簇;
- 標簽系統統一30+維度,接入推薦、廣告和反作弊系統;
- 實現標簽異步更新機制,降低資源開銷30%。
虛假交易識別系統(美團)
- 構建交易網絡圖,引入 GAT 進行節點表示學習;
- 使用無監督圖聚類方法發現潛在團伙,結合規則系統實時攔截;
- 系統部署后,整體識別準確率提升至91%,極大降低用戶投訴率。
🏆 競賽經歷 / Competitions & Awards
-
🥈 Kaggle - Santander Customer Transaction Prediction(Top 2%)
構建堆疊模型 + 特征組合策略,團隊協作完成200+特征篩選與融合。 -
🥉 阿里天池用戶增長算法大賽 全國三等獎
提出 LightGBM + 用戶行為時間窗特征方案,精度顯著優于baseline。 -
🎖? “中國研究生數學建模競賽” 國家二等獎
🎓 教育背景 / Education
北京航空航天大學
碩士,計算機科學與技術 | 2016.09 – 2018.06
山東大學
學士,信息管理與信息系統 | 2012.09 – 2016.06
🧠 技能清單 / Skills
- 編程語言:Python(Pandas, Numpy, Sklearn, PyTorch), SQL, Shell
- 模型方法:XGBoost, LightGBM, DeepFM, GNN(GAT/GCN), MMoE, Transformer
- 平臺工具:Hive, Spark, Airflow, TensorFlow Serving, Docker, Faiss, Kafka
- 領域經驗:推薦系統、反欺詐檢測、圖建模、特征工程、AB實驗
📃 補充信息 / Additional
- 英語水平:CET-6,具備良好的技術文檔閱讀能力;
- 技術博客作者,撰寫30+篇機器學習實戰筆記(yourblog.com);
- 開源項目參與者,貢獻于 RecBole / DGL 圖學習框架。