2月9日在洛杉磯舉行的第11屆網絡搜索與數據挖掘國際會議(WSDM 2018)上,公布了今年的WSDM Cup競賽成績,來自阿里巴巴的AliOS團隊憑借優秀的算法能力,摘得榜眼。
這是該賽事舉辦11屆以來,中國企業在該賽事上首次取得的最高名次。阿里技術同學受邀赴美做Oral報告并領獎。
圖:阿里技術同學受邀做Oracl報告并領獎
WSDM被譽為信息檢索領域最頂級的會議之一,本次WSDM Cup挑戰賽有來自全球575只隊伍參賽,包括中國科學技術大學、北京大學、巴黎綜合理工學校、微軟等全球知名高校和企業參加。
此次比賽出題方是一家名為KKBOX的流媒體音樂公司,賽題內容是預測3月訂閱到期的用戶中,哪些會流失。
具體是參賽者要利用KKBOX數據集建立智能算法來預測訂閱用戶是否會流失。對于依賴訂閱業務的KKBOX來說,準確預測流失率是業務成功的關鍵。通過結果分析,以便KKBOX進一步了解用戶需求,在保持用戶活躍度上進一步采取營銷行動。
為解決該題,阿里巴巴算法團隊使用了兩層Stacking Model,第一層采用邏輯回歸、隨機森林、XGBoost算法,第二層又采用XGBoost算法把第一層的結果融合,最終實現了精準預測。WSDM會議同時收錄了技術團隊提交的名為《A Practical Pipeline with Stacking Models for KKBox’s Churn Prediction Challenge》的論文。
其實早在KDD Cup2016的時候,阿里巴巴就開始嘗試使用Stacking Model,經過兩年的優化,如今該模型已經是一個比較完備的算法模型。
流失用戶預測,對有會員體系的業務場景都可以使用,其中會員付費為主要收入的業務就更為關鍵,比如像Apple Music、蝦米音樂。
多層Stacking Model由AliOS神燈研發,極大提升了分類預測的準確率,已廣泛應用于AliOS多項業務中。