【論文閱讀】Contrastive Clustering Learning for Multi-Behavior Recommendation

論文地址：Contrastive Clustering Learning for Multi-Behavior Recommendation | ACM Transactions on Information Systems

摘要

近年來，多行為推薦模型取得了顯著成功。然而，許多模型未充分考慮不同行為之間的共性與差異性，以及目標行為的數據稀疏性問題。本文提出了一種基于對比聚類學習的全新多行為推薦模型（MBRCC）。

具體而言，采用圖卷積網絡（GCN）分別獲取用戶和物品的嵌入表示。隨后，設計了三種優化用戶和物品嵌入的任務，包括行為級嵌入、實例級嵌入和聚類級嵌入。

在行為級嵌入中，設計了一種自適應參數學習策略，以分析輔助行為對目標行為的影響，并通過對用戶在各行為上的嵌入進行加權，獲得最終的用戶嵌入表示。

在實例級嵌入中，利用對比學習對用戶和物品實例進行分析，以緩解數據稀疏性問題。

在聚類級嵌入中，設計了一種新的聚類對比學習方法，以捕捉用戶和物品群體之間的相似性。

最終，結合這三種任務，以提升用戶和物品嵌入的質量。在三個真實世界數據集上的廣泛實驗表明，MBRCC 顯著優于現有的多種推薦模型。

引言

推薦系統在在線廣告、社交媒體和電子商務等多個領域發揮著至關重要的作用。它通過智能信息過濾和個性化推薦，幫助用戶快速找到符合其興趣和需求的內容。個性化推薦不僅提升了用戶體驗，還促進了商業交易的成功。

目前，大多數推薦模型主要關注用戶與物品之間的單一行為關系。例如，Zheng 等人[57]提出了一種基于單一行為數據挖掘物品屬性信息的推薦方法；Wang 等人[36]在單一行為數據上研究了用戶-物品的高階信息；Li 等人[24]利用元學習方法提升用戶和物品的表示效果；Lan 等人[21]基于歷史交互數據構建了用戶和物品的雙分支圖來捕獲信息。然而，在實際應用中，用戶和物品的交互通常涉及多種行為類型。例如，如圖 1 所示，在電子商務平臺上，用戶的行為通常包括瀏覽、點擊和購買等。此外，與用戶交互的物品數量不斷增長，僅依賴單一行為難以準確推測用戶的偏好，因此需要借助輔助行為進行推薦。

為了充分利用輔助行為信息，近年來涌現出越來越多的多行為推薦模型。例如，Gao 等人[9]提出了一種基于神經網絡的多任務推薦框架，以級聯方式關聯各類行為，利用用戶在購買前通常瀏覽相關感興趣物品的現象來整合不同行為信息；Jin 等人[17]提出了一種多行為推薦模型，通過用戶-物品交互的傳播層捕捉行為強度，并通過物品-物品交互的傳播層捕捉行為語義；Chen 等人[7]提出了一種基于多行為的推薦模型，在可控時間復雜度下高效捕捉不同行為信息，該模型采用基于用戶、基于物品和交替優化的三種方法來挖掘不同行為間的復雜關系。此外，Chen 等人[5]考慮到用戶和物品交互中的高階協同信息，提出了一種基于協同過濾的異構圖推薦模型，該模型采用關系感知傳播層顯式獲取高階信號；Wei 等人[39]提出了一種基于多種行為類型圖的注意力多行為推薦模型，以捕捉用戶-物品交互網絡中的隱藏關系，該模型同時考慮了節點級特定行為的重要性和行為級不同行為的語義強度。此外，一些研究還結合了對比學習與多行為推薦。例如，Gu 等人[11]提出了一種基于自監督圖卷積網絡（GCN）的多行為推薦模型，以緩解監督信號稀疏問題，該模型采用星型對比學習策略來學習不同行為之間的共性；Wu 等人[42]提出了一種基于多視圖的多行為對比學習推薦模型，以有效緩解冷啟動問題，該模型整合了多行為、多視圖和行為區分的對比學習。

盡管上述研究在提升推薦性能方面取得了顯著進展，但仍然存在以下局限性：
(1) 一些多行為推薦的對比學習方法主要基于個體行為，缺乏從群體角度綜合考慮不同行為，這通常導致用戶和物品的嵌入表示無法全面覆蓋行為信息；
(2) 由于相似用戶的行為通常具有共性，而不同用戶的行為往往存在差異，因此用戶和物品的共性與差異可提供更豐富的語義信息。然而，部分模型未充分考慮用戶或物品之間的共性與差異，可能導致群體偏差或信息過濾不足；
(3) 部分方法忽視了目標行為的數據稀疏性問題。例如，相較于點擊、瀏覽和加入購物車等行為，購買行為的數據較為稀疏，這可能導致推薦偏差或冷啟動問題，因為對比學習中難以構造足夠數量和多樣性的正負樣本對。

針對現有多行為推薦模型的這些局限性，本文提出了一種基于對比聚類學習的全新多行為推薦模型（MBRCC）。具體而言，采用 GCN 獲取用戶和物品在不同行為上的嵌入表示，并圍繞這些嵌入設計三類任務，以提升嵌入質量：
(a) 行為級嵌入：采用自適應參數學習策略計算用戶在不同行為上的嵌入權重，并通過加權方法融合所有行為的用戶嵌入；
(b) 實例級嵌入：基于用戶和物品不同行為間的共性，采用對比學習優化用戶和物品的嵌入表示，使正樣本對之間的共性最大化，負樣本對之間的共性最小化；
(c) 聚類級嵌入：多行為數據通常展現出類似的群體模式，因此采用對比聚類學習方法挖掘用戶和物品嵌入的潛在信息，以促進實例級用戶和物品之間的共性。

在三個真實世界數據集上對 MBRCC 進行了實驗評估，結果表明，相較于其他基線模型，本文的方法在所有數據集上至少提升了 7% 的推薦性能。本文的主要貢獻如下：

提出了一種新型多行為推薦模型（MBRCC），包括行為級嵌入、實例級嵌入和聚類級嵌入，并首次在多行為推薦任務中應用對比聚類學習，以捕捉用戶和物品的嵌入信息；
在實例級嵌入中考慮了用戶和物品之間的共性與差異，同時引入群體聚類級嵌入，最大化用戶和物品之間的關聯信息利用率，從而有效緩解數據稀疏性問題；
在三個真實數據集上驗證了 MBRCC 模型的有效性，實驗結果表明，MBRCC 在推薦性能上顯著優于現有模型。

模型

所提出的模型 (MBRCC) 如圖 2 所示，主要包含四個部分。

在嵌入表示部分，異構圖 G 根據行為類別劃分為 K?個子圖。此外，為了獲取完整的嵌入信息，設計了三種任務。在行為級別嵌入中，方法側重于獲取用戶在每個子圖上的嵌入權重。這些權重與相應子圖的嵌入進行聚合，以更好地捕獲用戶行為在不同子圖中的重要性。對于物品嵌入，采用簡單的拼接操作，因為它們具有靜態屬性。在實例級別嵌入中，采用對比學習方法，將目標行為（即購買行為）的用戶和物品嵌入與其他輔助行為進行比較，利用對比學習策略提取用戶和物品之間的實例級共性信息，作為局部特征。在聚類級別嵌入中，針對每種輔助行為獲取特征組，并將目標行為加入這些特征組中。然后，使用 softmax 方法在每個特征組中獲取不同的特征簇，并在各特征簇之間進行對比學習。最終，這三種任務相結合，以優化用戶和物品的嵌入。