漲指標的方法有哪些?
- 改進召回模型,添加新的召回模型
- 改進粗排和精排模型
- 提升召回,粗排,精排的多樣性
- 特殊對待新用戶嗎,低活用戶等特殊人群
- 利用關注,轉發,評論這三種交互行為
排序的多樣性
精排多樣性
- 精排階段,結合興趣分數和多樣性分數對物品 iii 排序
- sis_isi?:興趣分數,即融合點擊率等多個預估指標
- did_idi?:多樣性分數,即物品 iii 與已經選中的物品的差異
- 用 si+dis_i+d_isi?+di? 對物品做排序,這個排序幾乎決定了最終用戶看到的結果
- 常用 MRR,DPP 等方法計算多樣性分數,精排使用滑動窗口,粗排不使用滑動窗口
- 精排決定最終的曝光,曝光頁面上鄰近的物品相似度應該小,所以計算精排多樣性要使用滑動窗口,保證同一個滑動窗口內的物品要有足夠的差異
- 粗排要考慮整體的多樣性,而非一個滑動窗口中的多樣性
- 除了多樣性分數,精排還使用打散策略增加多樣性
- 類目:當前選中物品 iii,之后 555 個位置不允許跟 iii 的二級類目相同
- 多模態:事先計算物品多模態內容向量表征,講全庫物品聚為 100010001000 類;在精排階段,如果當前選中物品 iii,之后 10 個位置不允許跟 iii 同屬一個聚類。道理是同一類物品的圖片和文字應該相似,需要打散
粗排多樣性
- 粗排給 500050005000 個物品打分,選出 500500500 個物品送入精排
- 提升粗排和精排多樣性都可以提升推薦系統的核心指標
- 根據 sis_isi? 對 5000 個物品排序,分數最高的 200 個物品送入精排。之類暫且不考慮多樣性分數,將用戶最感興趣的物品送入精排
- 對于剩余的 4800 個物品,對每個物品 iii 計算興趣分數 sis_isi? 和多樣性分數 did_idi?
- 根據 si+dis_i+d_isi?+di? 對剩余 4800 個物品排序,分數最高的 300 個物品送入精排。這 300 個既是用戶感興趣的,也保證了差異
召回的多樣性
雙塔模型:添加噪聲
- 雙塔模型是最重要的召回模型
- 用戶塔將用戶特征作為輸入,輸出用戶的向量表征;然后做 ANN 檢索,召回向量相似度高的物品
- 線上做召回時(在計算出用戶向量后,做 ANN 檢索之前),往用戶向量中添加隨機噪聲
- 用戶的興趣越窄(比如用戶最近交互的 nnn 個物品只覆蓋少數幾個類目),則添加的噪聲越強
- 添加噪聲使得召回的物品更多樣,可以提升推薦系統核心指標。按道理來說添加噪聲會使得召回不準,但是很神奇的是可以漲指標
雙塔模型:抽樣用戶行為序列
- 用戶最近交互的 nnn 個物品(用戶行為序列)是用戶塔的輸入
- 保留最近的 rrr 個物品 (r<<n)(r<<n)(r<<n)
- 從剩余的 n?rn-rn?r 個物品中隨機抽樣 ttt 個物品 (t<<n)(t<<n)(t<<n),可以是均勻抽樣,也可以用非均勻抽樣讓類目平衡
- 將得到的 r+tr+tr+t 個物品作為用戶行為序列,而不是用全部 nnn 個物品
- 推薦系統的用戶每天可能會刷好幾十次,每次都會做召回和排序。每次做召回的時候都會對用戶隨機行為序列做抽樣,這樣會讓雙塔召回的結果有隨機性,哪怕同時做兩次召回,召回的結果也會有較大差異,即多樣性提升
- 抽樣用戶行為為什么能漲指標?
- 一方面:注入隨機性,召回結果更多樣化
- 另一方面,nnn 可以非常大,可以利用到用戶很久之前的興趣
U2I2I:抽樣用戶行為序列
- U2I2I(user → item → item) 中的第一個 item 是指用戶最近交互的 nnn 個物品之一,在 U2I2I 中叫做種子物品
- nnn 個物品覆蓋的類目數教少,且類目不平衡
- 系統總共有 200 個類目,某用戶的 nnn 個物品只能覆蓋 15 個類目
- 足球類目的物品有 0.4n0.4n0.4n 個,電視劇類目的物品有 0.2n0.2n0.2n 個,其余類目的物品數均少于 0.05n0.05n0.05n 個。如果只用 nnn 個種子物品,那么大部分肯定都會召回到足球和電視劇,多樣性很差
- 做非均勻隨機抽樣,從 nnn 個物品中選出 ttt 個,讓類目平衡(想法和效果與用戶行為序列抽樣類似)
- 用抽樣得到的 ttt 個物品(代替原本的 nnn 個物品)作為 U2I2I 的種子物品
- 一方面,使類目更平衡,多樣性更好。另一個方面,nnn 可以更大,覆蓋的類目更多
探索流量
- 每個用戶曝光的物品中有 2%2\%2% 是非個性化的,用作興趣探索
- 維護一個精選內容池,其中物品均為交互率指標高的優質物品(內容池可以分人群,比如 30 到 40 歲男性內容池)
- 既然沒有了個性化,就要提高物品質量來吸引用戶。用高質量彌補多樣性
- 從精選內容池中隨機抽樣幾個物品,跳過排序,直接插入最終排序結果。
- 這些物品沒有經過用戶的交互,大概率會被淘汰掉,所以直接插入
- 興趣探索在短期內負向影響核心指標,但長期會產生正向指標
- 做非個性化的推薦用戶大概率不感興趣,點擊偏低,用戶不看,2%2\%2% 的流量大部分會被浪費掉。
- 興趣探索長期是有利的,可以發掘更多興趣點更好提升用戶留存