多任務學習-ESMM

簡介

ESMM(Entire Space Multi-task Model)是2018年阿里巴巴提出的多任務學習模型。基于共享的特征表達和在用戶整個行為序列空間上的特征提取實現對CTR、CVR的聯合訓練

解決的問題

SSB(sample selection bias)

如下圖1所示,傳統的CVR模型的訓練樣本是基于點擊樣本構成的,只是真實展現樣本的一部分

圖1 SSB

DB(data sparsity)

訓練CTR模型的數據量比CTR模型的量級少很多,相對較少的數據量增加了模型訓練的難度

解決的方案

針對SSB

方案

在整個用戶行為序列空間上建模(Modeling over entire space)

數學表達

如下所示:

(公式1)

其中,y、z分別表示CTR、CVR的label,pCTCVR = p(y=1,z=1|x)、pCTR = p(y=1|x)都是在整個樣本空間上建模的,最終得到pCVR

針對DB

方案

共享用戶整個行為序列空間上的特征表達(Feature representation transfer),對于CVR網絡可以實現從展現但未點擊的樣本中學習

模型結構和Loss設計

模型結構

圖2 ESMM模型結構

其中,CTR、CVR網絡共享embedding參數。

Loss

  1. 考慮Loss的時候,考慮pCTCVR、pCTR的交叉熵損失之和,而不單獨考慮pCTCVR、pCTR來訓練模型然后基于公式(1)計算pCVR。原因在于:
    1. 可以達到聯合訓練的目的
    2. pCTR是很小的數值,若單獨訓練則采用除法會帶來計算的不穩定,導致pCVR不在[0,1]區間。
  2. 具體的Loss如下所示
(公式2)

其中,l(·)是交叉熵損失函數。

模型效果

數據集

分為Public Datase、Product Dataset,均來自淘寶推薦系統的traffic logs。數據集詳情如下:

圖3 數據集大小

數據集下載鏈接:數據集下載鏈接

各模型相同的參數

  1. 激活函數:ReLU
  2. embedding維度:18維
  3. MLP每層維度:360*200*80*2
  4. adam求解器:beta1 = 0.9,beta2 = 0.999,平滑項=10^(-8)

Public Dataset的模型效果

數據集劃分

50%數據訓練,50%數據做測試

模型效果

圖4 Public Dataset的模型效果

對比CVR、CTCVR結果

  1. CTCVR的計算:pCTCVR = pCTR * pCVR
  2. pCVR:訓練上述的每個模型得到的結果
  3. pCTR:基于同一個被獨立訓練的CTR模型(和BASE模型采用想用的結構和超參)得到

各CVR模型說明

模型樣本模型說明
BASE有點擊的樣本結構為圖2的ESMM模型結構中的CVR網絡
AMAN所有的展現樣本negative sampling strategyand best results are reported with sampling rate searched in {10%, 20%, 50%, 100%}模型對應的文獻:One-class collaborative fltering(2008年)
OVERSAMPLING有點擊的樣本copies positive examples to reduce difficulty of training with sparse data,with sampling rate searched in {2, 3, 5, 10}模型對應的文獻:Mining with rarity: a unifying framework(2004年)
UNBIAS有點擊的樣本fit the truly underlying distribution from observations via rejection sampling模型對應的文獻:Bid-aware gradient descent for unbiased learning with censored data in display advertising(2016年)
DIVISION所有的展現樣本estimates pCTR and pCTCVR with individually trained CTR and CTCVR networks and calculates pCVR by 公式1
ESMM-NS所有的展現樣本a lite version of ESMM without sharing of embedding parameters
ESMM所有的展現樣本相比ESMM-NS,有共享的embedding參數

Product Dataset的模型效果

圖5 Product Dataset的模型效果

注:各模型說明同Public Dataset的模型效果

結尾

親愛的讀者朋友:感謝您在繁忙中駐足閱讀本期內容!您的到來是對我們最大的支持??

正如古語所言:"當局者迷,旁觀者清"。您獨到的見解與客觀評價,恰似一盞明燈💡,能幫助我們照亮內容盲區,讓未來的創作更加貼近您的需求。

若此文給您帶來啟發或收獲,不妨通過以下方式為彼此搭建一座橋梁: ? 點擊右上角【點贊】圖標,讓好內容被更多人看見 ? 滑動屏幕【收藏】本篇,便于隨時查閱回味 ? 在評論區留下您的真知灼見,讓我們共同碰撞思維的火花

我始終秉持匠心精神,以鍵盤為犁鏵深耕知識沃土💻,用每一次敲擊傳遞專業價值,不斷優化內容呈現形式,力求為您打造沉浸式的閱讀盛宴📚。

有任何疑問或建議?評論區就是我們的連心橋!您的每一條留言我都將認真研讀,并在24小時內回復解答📝。

愿我們攜手同行,在知識的雨林中茁壯成長🌳,共享思想綻放的甘甜果實。下期相遇時,期待看到您智慧的評論與閃亮的點贊身影?!

萬分感謝🙏🙏您的點贊👍👍、收藏?🌟、評論💬🗯?、關注??💚~?


自我介紹:一線互聯網大廠資深算法研發(工作6年+),4年以上招聘面試官經驗(一二面面試官,面試候選人400+),深諳崗位專業知識、技能雷達圖,已累計輔導15+求職者順利入職大中型互聯網公司。熟練掌握大模型、NLP、搜索、推薦、數據挖掘算法和優化,提供面試輔導、專業知識入門到進階輔導等定制化需求等服務,助力您順利完成學習和求職之旅(有需要者可私信聯系)?

友友們,自己的知乎賬號為“快樂星球”,定期更新技術文章,敬請關注!???

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913153.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913153.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913153.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

K8S 集群配置踩坑記錄

系統版本:Ubuntu 22.04.5-live-server-amd64 K8S 版本:v1.28.2 Containerd 版本: 1.7.27 kubelet logs kuberuntime_sandbox.go:72] "Failed to create sandbox for pod" err"rpc error: code Unknown desc failed to cre…

超濾管使用與操作流程-實驗操作013

超濾管使用與操作流程 超濾管(或蛋白濃縮管)是一種重要的實驗設備,廣泛應用于分離與純化大分子物質,尤其是蛋白質、多糖和核酸等。其工作原理依賴于超濾技術,通過半透膜對分子進行篩分,精準地將大分子物質…

GitHub已破4.5w star,從“零樣本”到“少樣本”TTS,5秒克隆聲音,沖擊傳統錄音棚!

嗨,我是小華同學,專注解鎖高效工作與前沿AI工具!每日精選開源技術、實戰技巧,助你省時50%、領先他人一步。👉免費訂閱,與10萬技術人共享升級秘籍!你是否為錄音成本高、聲音不靈活、又想為多語言…

【中文核心期刊推薦】《遙感信息》

《遙感信息》(CN:11-5443/P)是一份具有較高學術價值的雙月刊期刊,自創刊以來,憑借新穎的選題和廣泛的報道范圍,兼顧了大眾服務和理論深度,深受學術界和廣大讀者的關注與好評。 該期刊創辦于1986…

uniapp微信小程序css中background-image失效問題

項目場景:提示:這里簡述項目相關背景:在用uniapp做微信小程序的時候,需要一張背景圖,用的是當時做app的時候的框架,但是,在class的樣式中background-image失效了,查了后才知道&#…

iOS App無源碼安全加固實戰:如何對成品IPA實現結構混淆與資源保護

在很多iOS項目交付中,開發者或甲方并不總能拿到應用源碼。例如外包項目交付成品包、歷史項目維護、或者僅負責分發渠道的中間商,都需要在拿到成品ipa文件后對其進行安全加固。然而傳統的源碼級混淆方法(如LLVM Obfuscator、Swift Obfuscator&…

Java 中的 ArrayList 和 LinkedList 區別詳解(源碼級理解)

🚀 Java 中的 ArrayList 和 LinkedList 區別詳解(源碼級理解) 在日常 Java 開發中,ArrayList 和 LinkedList 是我們經常用到的兩種 List 實現。雖然它們都實現了 List 接口,但在底層結構、訪問效率、插入/刪除操作、擴…

使用OpenLayers調用geoserver發布的wms服務

1.前端vue3調用代碼 <template><div><div ref"mapContainer" class"map"></div></div> </template><script setup lang"ts"> import { ref, onMounted } from "vue"; import Map from &quo…

二十七、【測試執行篇】測試計劃:前端一鍵觸發測試 實時狀態追蹤

二十七、【測試執行篇】測試計劃:前端一鍵觸發測試 & 實時狀態追蹤 前言準備工作第一部分:后端 API 確認第二部分:前端實現 - 觸發執行與狀態輪詢第三部分:后端 API 增強第四部分:全面測試總結前言 一個完整的自動化測試流程,從測試用例的創建到報告的生成,最終都需…

60天python訓練營打卡day52

學習目標&#xff1a; 60天python訓練營打卡 學習內容&#xff1a; DAY 52 神經網絡調參指南 知識點回顧&#xff1a; 1.隨機種子 2.內參的初始化 3.神經網絡調參指南 a.參數的分類 b.調參的順序 c.各部分參數的調整心得 作業&#xff1a;對于day’41的簡單cnn&#xff0c;看…

【Modern C++ Part3】Understand-decltype

條款三&#xff1a;理解decltype decltype是一個怪異的發明。給定一個變量名或者表達式&#xff0c;decltype會告訴你這個變量名或表達式的類型。decltype的返回的類型往往也是你期望的。然而有時候&#xff0c;它提供的結果會使開發者極度抓狂而不得參考其他文獻或者在線的Q&…

前端批量請求場景

文章目錄 一、批量請求1、Promise.allSettled2、返回值穿透 二、案例1、 批量任務2、緩存優化3、另一種實現方式 一般時候前端都是簡單的查詢任務&#xff0c;復雜的數據獲取都是后臺處理好再返回&#xff0c;如果遇到接口流程化處理、數據組裝&#xff0c;可以參考一下。 一、…

芊芊妙音:智能變聲,玩轉聲音魔法

在當今豐富多彩的社交和娛樂環境中&#xff0c;聲音的魅力正逐漸被更多人發現和利用。無論是線上社交、短視頻創作還是直播互動&#xff0c;一個獨特而有趣的聲音總能讓人眼前一亮&#xff0c;甚至成為個人風格的一部分。《芊芊妙音》正是這樣一款能夠幫助用戶輕松實現聲音變換…

安防監控視頻匯聚平臺EasyCVR v3.7.2版云端錄像無法在web端播放的原因排查和解決方法

有用戶反饋&#xff0c;在使用EasyCVR視頻匯聚平臺時&#xff0c;發現云端錄像無法在Web頁面正常播放。為幫助大家高效解決類似困擾&#xff0c;本文將詳細剖析排查思路與解決方案。 用戶軟件版本信息&#xff1a; 問題排查與解決步驟&#xff1a; 1&#xff09;問題復現驗證…

vxe-upload vue 實現附件上傳、手動批量上傳附件的方式

vxe-upload vue 實現附件上傳、手動批量上傳附件的方式 查看官網&#xff1a;https://vxeui.com 安裝 npm install vxe-pc-ui4.6.47// ... import VxeUIAll from vxe-pc-ui import vxe-pc-ui/lib/style.css // ...createApp(App).use(VxeUIAll).mount(#app) // ...上傳附件支…

leaflet【十一】地圖瓦片路徑可視化

前言 在開發調試過程當中&#xff0c;如果引入的是公司內部的Gis地圖信息或者一些第三方定制來的Gis地圖數據&#xff0c;當某一些地圖塊數據缺失的時候&#xff0c;要打開F12去一個個找那些鏈接&#xff08;去找對應的xy與layer&#xff09;失效、那么你可能需要使用以下插件…

ES6從入門到精通:模塊化

ES6 模塊化基礎概念ES6 模塊化是 JavaScript 官方標準&#xff0c;通過 import 和 export 語法實現代碼拆分與復用。模塊化特點包括&#xff1a;每個文件是一個獨立模塊&#xff0c;作用域隔離。支持靜態分析&#xff0c;依賴關系在編譯時確定。輸出的是值的引用&#xff08;動…

stm32 USART串口協議與外設——江協教程踩坑經驗分享

江協stm32學習&#xff1a;9-1~9-3 USART串口協議與外設 一、串口通信基礎知識 1、通信類型&#xff1a; 全雙工通信&#xff1a;通信雙方能夠同時進行雙向通信。一般有兩根通信線&#xff0c;如USART中的TX&#xff08;發送&#xff09;和RX&#xff08;接收&#xff09;線&am…

深度學習中的一些名詞

向前傳播 forward pass 在機器學習中&#xff0c;輸入的feature, 通過預測模型&#xff0c;輸出預測值&#xff0c;此過程稱之為向前傳播&#xff1b; 向后傳播 backward pass 為了將預測與真實值的產值減小&#xff0c;需要根據差值&#xff0c;更新模型中的參數&#xff0c;此…

鴻蒙系統(HarmonyOS)應用開發之手勢鎖屏密碼鎖(PatternLock)

項目概述 基于鴻蒙&#xff08;OpenHarmony&#xff09;平臺開發的手勢密碼鎖應用&#xff0c;旨在為用戶提供安全、便捷且具有良好交互體驗的身份驗證方式。通過手勢圖案輸入&#xff0c;用戶可以輕松設置和驗證密碼&#xff0c;提升設備的安全性和個性化體驗。 功能特點 手…