論文筆記-WSDM2024-LLMRec: Large Language Models with Graph Augmentation for Recommendation
- LLMRec: 基于圖增強的大模型推薦
- 摘要
- 1.引言
- 2.前言
- 2.1使用圖嵌入推薦
- 2.2使用輔助信息推薦
- 2.3使用數據增強推薦
- 3.方法
- 3.1LLM作為隱式反饋增強器
- 3.2基于LLM的輔助信息增強
- 3.2.1用戶畫像與項目屬性增強
- 3.2.2輔助信息融合
- 3.3使用去噪穩健機制訓練
- 3.3.1帶噪聲剪枝的增強優化
- 3.3.2通過MAE增強語義特征
- 4.實驗
- 4.1實驗設置
- 4.2模型性能
- 4.3消融實驗
- 4.4超參數實驗
- 5.總結
LLMRec: 基于圖增強的大模型推薦
論文: LLMRec: Large Language Models with Graph Augmentation for Recommendation
代碼: LLMRec
摘要
以往的研究通過引入輔助信息來解決數據稀疏問題,但這種方法常常引發噪聲、可用性差和低數據質量等問題,從而影響用戶偏好的準確建模。
本文提出了一個名為LLMRec的新框架,基于LLM圖增強策略提升推薦系統。LLMRec通過三種方式增強交互圖:(i) 強化用戶-項目交互邊,(ii) 加深對項目節點屬性的理解,以及 (iii) 從自然語言角度生成用戶畫像。此外,為確保增強數據的質量,本文還開發了一種去噪數據穩健化機制,包括噪聲隱式反饋剪枝和基于MAE的特征增強技術,以優化增強數據并提高其可靠性。
1.引言
輔助信息的數據質量問題包括:i) 數據噪聲:屬性或特征可能與用戶偏好缺乏直接相關性。ii) 數據異質性:每種信息都有獨特的特征、結構和表示,忽略這種異質性會導致分布失衡。iii) 數據不完整性:項目可能有不完整的文本描述或缺少關鍵的屬性。
本文旨在通過顯式增強潛在用戶-項目交互邊以及改進用戶/項目節點的輔助信息來克服這些挑戰。首先,LLMRec利用LLMs從自然語言的角度預測用戶-項目交互。與間接的ID嵌入相比,自然語言表示更直觀地反映了用戶偏好。其次,LLMs在大量現實世界知識上進行訓練,可以理解用戶偏好并提供有價值的補充信息。另外,LLMs的綜合詞庫將嵌入統一到一個向量空間中,縮小了異質特征之間的差距,促進了編碼器的計算。這樣的整合防止了特征在不同向量空間中的分散,從而提供了更準確的結果。
其主要貢獻可以概述如下:
-
LLMRec 是一項開創性工作,利用LLMs進行圖增強,包括:i) 用戶-項目交互邊,ii) 項目節點屬性,iii) 用戶節點畫像。
-
所提出的 LLMRec 通過使 LLM 能夠明確推理用戶-項目交互模式,解決了隱式反饋信號稀缺的問題。
-
通過用戶/項目屬性生成和去噪增強穩健機制(結合噪聲反饋修剪和基于 MAE 的特征增強)解決了低質量輔助信息的問題。
2.前言
2.1使用圖嵌入推薦
CF通過稀疏的隱式反饋 E + E^+ E+ 學習,旨在獲取協同用戶-物品對應的嵌入 E u ? E_u? Eu?? 和 E i ? E_i? Ei??,以進行推薦。部分推薦系統采用圖神經網絡(GNNs)來建模復雜的高階用戶-物品關系,將 E + E^+ E+ 視為稀疏交互圖的邊。因此,CF 過程可以分為兩個階段:二分圖嵌入和用戶-物品預測。優化協同圖嵌入 E = { E u , E i } E = \{ E_u, E_i \} E={Eu?,Ei?} 的目標是最大化后驗估計,形式化表示如下:
其中, p ( E ∣ E + ) p(E|E^+) p(E∣E+) 的目標是盡可能多地將 E + E^+ E+ 中的用戶-物品關系編碼到 E u ? E_u? Eu?? 和 E i ? E_i? Ei?? 中,以實現準確的用戶-物品預測。
2.2使用輔助信息推薦
為了解決數據稀疏性問題,許多研究引入了形式為節點特征 F F F 的輔助信息,將推薦器編碼器 f Θ ? f_\Theta? fΘ?? 視為特征圖。帶有輔助信息 F F F 的 f Θ f_\Theta fΘ? 的學習過程被表述為最大化后驗估計 p ( Θ ∣ F , E + ) p(\Theta|F, E^+) p(Θ∣F,E+):
2.3使用數據增強推薦
盡管將輔助信息引入推薦系統取得了顯著進展,但低質量的輔助信息可能會削弱稀疏交互數據 E + E^+ E+ 的有效性。LLMRec 專注于用戶-物品交互特征圖的增強,這涉及到 LLM 增強的用戶-物品交互邊 E A ? E_A? EA?? 和 LLM 生成的節點特征 F A ? F_A? FA??。增強交互特征圖的優化目標為:
3.方法
LLMRec的框架如圖1所示。
3.1LLM作為隱式反饋增強器
采用LLM作為知識感知采樣器,從自然語言的角度對用戶-物品(u-i)訓練數據進行成對采樣。具體而言,將每個用戶的歷史交互物品與輔助信息(如年份、類型)以及物品候選池 C u C_u Cu? 輸入到 LLM 中。然后,LLM從 C u ? C_u? Cu?? 中選擇用戶 u u u 可能交互的物品( i u + i^+_u iu+?)或不太可能交互的物品( i u ? i^-_u iu??)。增強用戶-物品交互邊并將其納入訓練數據的過程可以形式化為:
其中, i u + , i u ? ? i^+_u, i^-_u? iu+?,iu??? 是 LLM 基于輸入提示 P u U I ?? P^{UI}_u?? PuUI???從候選集 C u ? C_u? Cu?? 中為用戶 u u u 選擇的 BPR 正負樣本,增強數據集 E A ? E_A? EA?? 包含成對訓練三元組 ( u , i u + , i u ? ) (u, i^+_u, i^-_u) (u,iu+?,iu??)。文本的 u-i 增強提示 P u U I ?? P^{UI}_u?? PuUI??? 包含不同的組成部分:i) 任務描述,ii) 歷史交互,iii) 候選物品,以及 iv) 輸出格式描述,如圖 2(a) 所示。
3.2基于LLM的輔助信息增強
3.2.1用戶畫像與項目屬性增強
LLM 基于輔助信息增強范式包括兩個步驟:
-
用戶/物品信息精煉。通過使用從數據集的交互和輔助信息中衍生的提示,使 LLM 生成不在數據集中的用戶和物品屬性。具體示例見圖 2(b)?。
-
LLM 增強的語義嵌入。增強后的用戶和物品信息將被編碼為特征,并作為推薦系統的輸入。使用 LLM 作為編碼器提供了高效且先進的語言理解能力,使得用戶交互偏好畫像化并消除物品屬性的偏見。
形式上,基于 LLM 的輔助信息增強如下:
其中 f A , u , f A , i ∈ R d L L M ? f_{A,u}, f_{A,i} \in \mathbb{R}^{d_{LLM}}? fA,u?,fA,i?∈RdLLM?? 是經過 LLM 增強的用戶/物品特征,具有 LLM 的隱藏維度 d L L M d_{LLM} dLLM?。文本提示 P u U ?? P^U_u?? PuU??? 和 P i I ?? P^I_i?? PiI??? 分別用于用戶 u u u 和物品 i i i 的屬性精煉。 A u ? A_u? Au?? 和 A i ? A_i? Ai?? 表示生成的文本屬性,這些屬性將通過 LLM 的嵌入能力編碼為特征 F A , u , F A , i ? F_{A,u}, F_{A,i}? FA,u?,FA,i??。
3.2.2輔助信息融合
在獲得用戶/物品的增強輔助信息后,采用以下三個步驟融合信息:
-
增強語義投影。使用帶 dropout 的線性層,不僅減少 LLM 增強的語義特征的維度,還將這些增強特征映射到它們自己的空間。
-
協同上下文注入。為了將高階協同連接注入到增強特征中,LLMRec 使用輕量級的圖神經網絡作為編碼器。
-
語義特征融合。將增強特征 F A ? F_A? FA?? 視為附加組成部分,而不是作為推薦系統的可學習向量的初始化。這允許使用縮放因子和歸一化靈活調整 LLM 增強特征的影響。
形式上, F A ? F_A? FA?? 的融合表示為:
最終的預測表示 h u ? h_u? hu?? 和 h i ? h_i? hi?? 位于 R 1 × d \mathbb{R}^{1 \times d} R1×d。用戶畫像為 A u ? A_u? Au??,去偏見的物品屬性為 A i ? A_i? Ai??,原始的多模態輔助信息為 M M M。特征的具體類型為 f k ? f_k? fk??。使用聚合權重 ω 1 ? \omega_1? ω1?? 和 L 2 ? L_2? L2?? 歸一化來調整特征向量,以減輕分布差異,確保額外特征在推薦編碼器中的有效性。
3.3使用去噪穩健機制訓練
3.3.1帶噪聲剪枝的增強優化
本文使用并集 E ∪ E A ? E \cup E_A? E∪EA?? 訓練推薦系統,通過增加監督信號來優化 BPR 損失,利用整合的 LLM 增強用戶偏好來提升推薦系統的性能:
其中,正負樣本對的預測分數通過最終表示 h h h 的內積獲得,樣本數量 ∣ E A ∣ |E_A| ∣EA?∣ 由批量大小 B B B 和比率 ω 3 ? \omega_3? ω3?? 控制。權重衰減正則化 ∥ Θ ∥ 2 \|\Theta\|^2 ∥Θ∥2 由 ω 2 ? \omega_2? ω2?? 加權,以減輕過擬合。 σ ( ? ) \sigma(\cdot) σ(?) 是激活函數 sigmoid,用于引入非線性。
為了增強增強數據的有效性,本文選擇剔除不可靠的用戶-項目交互噪聲。具體來說,在每次迭代后,排序后丟棄最大的負值。這有助于優先考慮和強調相關的監督信號,同時減輕噪聲的影響。形式上,帶有噪聲修剪的目標 L B P R ? L_{BPR}? LBPR?? 可以重寫為:
其中,函數 SortAscend ( ? ) [ 0 : N ] \text{SortAscend}(\cdot)[0:N] SortAscend(?)[0:N] 對值進行排序并選擇前 N N N 個。保留的數量 N N N 由 N = ( 1 ? ω 4 ) ? ∣ E ∪ E A ∣ N = (1 - \omega_4) \cdot |E \cup E_A| N=(1?ω4?)?∣E∪EA?∣ 計算,其中 ω 4 ? \omega_4? ω4?? 是一個比率。該方法允許對損失樣本進行控制性修剪,強調相關信號,同時減少噪聲。這可以避免不可靠的梯度反向傳播的影響,從而使優化過程更加穩定和有效。
3.3.2通過MAE增強語義特征
為了減輕噪聲增強特征的影響,采用掩碼自編碼器MAE進行特征增強。形式上,選擇一個節點子集 e ? V e \subset V e?V 并使用掩碼標記 [MASK] 來掩蓋它們的特征,表示為 f [ MASK ] f[\text{MASK}] f[MASK]。掩碼操作可以表示為:
為了增強特征編碼器,引入特征恢復損失 L F R ? L_{FR}? LFR??,通過比較掩碼屬性矩陣與原始增強特征矩陣來實現,帶有一個縮放因子 γ \gamma γ。恢復損失函數 L F R ? L_{FR}? LFR?? 定義為:
最終的優化目標是噪聲修剪的 BPR 損失 L B P R ? L_{BPR}? LBPR?? 和特征恢復損失 L F R ? L_{FR}? LFR?? 的加權和。
4.實驗
4.1實驗設置
數據集:ML-10M和Netflix
基線:
-
一般CF方法:MFBPR,NGCF和LightGCN
-
帶有輔助信息的方法:VBPR,MMGCN和GRCN
-
數據增強方法:LATTICE
-
自監督方法:CLCRec,MMSSL和MICRO
4.2模型性能
結論:
-
LLMRec整體性能優越:LLMRec通過明確增強用戶-物品交互邊和提高輔助信息的質量,超越了基線模型。
-
輔助信息的有效性:輔助信息的整合顯著增強了推薦系統的能力,MMSSL和MICRO的性能優于NGCF。
-
不準確的增強對模型的改進有限:LATTICE和MICRO,也利用輔助信息進行數據增強,但與LLMRec相比,改進有限。
-
相對于自監督學習方法的優勢:MMSSL和MICRO的自監督模型在通過自監督信號解決稀疏性方面表現優異,然而并未超越LLMRec。
4.3消融實驗
結論:
-
w/o-u-i:禁用 LLM 增強的隱式反饋 E A ? E_A? EA?? 導致性能顯著下降。這表明,LLMRec通過包含上下文知識增加了潛在的監督信號,從而更好地把握用戶偏好。
-
w/o-u:去除用戶畫像增強器導致性能下降,這表明增強的用戶信息能夠有效地利用歷史交互和物品端知識來總結有用的用戶偏好畫像。
-
w/o-u&i:去除用戶和物品的增強輔助信息時,推薦準確性下降。這一發現表明,基于LLM的增強信息為推薦系統提供了有價值的增強數據,幫助獲得高質量和信息豐富的表示。
-
w/o-prune:去除噪聲修剪導致性能下降。這表明去除噪聲隱式反饋信號的過程有助于防止不正確的梯度下降。
-
w/o-QC:當同時去除對隱式反饋和語義特征質量的限制時,性能受到影響。這表明,通過整合噪聲修剪和語義特征增強,去噪數據魯棒性機制帶來了顯著的好處。
4.4超參數實驗
結論:
-
溫度系數 τ \tau τ:溫度系數 τ \tau τ 影響文本的隨機性。較高的值(>1.0)增加多樣性和創造性,而較低的值(<0.1)則導致更集中。如表 4 所示,增加 τ \tau τ 最初改善了大多數指標,但隨后出現下降。
-
Top-p 值 p p p:Top-p 采樣根據由 top-p 參數 p p p 決定的閾值選擇標記。較低的 p p p 值優先考慮可能的標記,而較高的值則鼓勵多樣性。較小的 p p p 值往往能產生更好的結果,可能是因為避免了未列出的候選選擇。較高的 p p p 值則會因重復的 LLM 推理導致標記浪費。
-
候選項數量 C C C:使用 C C C 來限制基于 LLM 的推薦的物品候選項。表 5 顯示 C = 10 C = 10 C=10 產生了最佳結果。較小的值限制了選擇,而較大的值則增加了推薦的難度。
5.總結
本研究旨在設計增強LLM的模型,以應對稀疏的隱式反饋信號和低質量輔助信息的挑戰,通過分析用戶互動偏好和去偏見商品屬性來實現。為了確保增強數據的質量,引入了一種去噪增強魯棒性機制。LLMRec 的有效性得到了理論分析和實驗結果的支持,展示了其在基準數據集上優于最先進推薦技術的優勢。未來的研究方向包括將因果推理整合到側信息去偏見中,以及探索上下文感知用戶偏好的反事實因素。