論文筆記-WSDM2024-LLMRec

論文筆記-WSDM2024-LLMRec: Large Language Models with Graph Augmentation for Recommendation

  • LLMRec: 基于圖增強的大模型推薦
  • 摘要
  • 1.引言
  • 2.前言
    • 2.1使用圖嵌入推薦
    • 2.2使用輔助信息推薦
    • 2.3使用數據增強推薦
  • 3.方法
    • 3.1LLM作為隱式反饋增強器
    • 3.2基于LLM的輔助信息增強
      • 3.2.1用戶畫像與項目屬性增強
      • 3.2.2輔助信息融合
    • 3.3使用去噪穩健機制訓練
      • 3.3.1帶噪聲剪枝的增強優化
      • 3.3.2通過MAE增強語義特征
  • 4.實驗
    • 4.1實驗設置
    • 4.2模型性能
    • 4.3消融實驗
    • 4.4超參數實驗
  • 5.總結

LLMRec: 基于圖增強的大模型推薦

論文: LLMRec: Large Language Models with Graph Augmentation for Recommendation
代碼: LLMRec

摘要

以往的研究通過引入輔助信息來解決數據稀疏問題,但這種方法常常引發噪聲、可用性差和低數據質量等問題,從而影響用戶偏好的準確建模。

本文提出了一個名為LLMRec的新框架,基于LLM圖增強策略提升推薦系統。LLMRec通過三種方式增強交互圖:(i) 強化用戶-項目交互邊,(ii) 加深對項目節點屬性的理解,以及 (iii) 從自然語言角度生成用戶畫像。此外,為確保增強數據的質量,本文還開發了一種去噪數據穩健化機制,包括噪聲隱式反饋剪枝和基于MAE的特征增強技術,以優化增強數據并提高其可靠性。

1.引言

輔助信息的數據質量問題包括:i) 數據噪聲:屬性或特征可能與用戶偏好缺乏直接相關性。ii) 數據異質性:每種信息都有獨特的特征、結構和表示,忽略這種異質性會導致分布失衡。iii) 數據不完整性:項目可能有不完整的文本描述或缺少關鍵的屬性。

本文旨在通過顯式增強潛在用戶-項目交互邊以及改進用戶/項目節點的輔助信息來克服這些挑戰。首先,LLMRec利用LLMs從自然語言的角度預測用戶-項目交互。與間接的ID嵌入相比,自然語言表示更直觀地反映了用戶偏好。其次,LLMs在大量現實世界知識上進行訓練,可以理解用戶偏好并提供有價值的補充信息。另外,LLMs的綜合詞庫將嵌入統一到一個向量空間中,縮小了異質特征之間的差距,促進了編碼器的計算。這樣的整合防止了特征在不同向量空間中的分散,從而提供了更準確的結果。

其主要貢獻可以概述如下:

  • LLMRec 是一項開創性工作,利用LLMs進行圖增強,包括:i) 用戶-項目交互邊,ii) 項目節點屬性,iii) 用戶節點畫像。

  • 所提出的 LLMRec 通過使 LLM 能夠明確推理用戶-項目交互模式,解決了隱式反饋信號稀缺的問題。

  • 通過用戶/項目屬性生成和去噪增強穩健機制(結合噪聲反饋修剪和基于 MAE 的特征增強)解決了低質量輔助信息的問題。

2.前言

2.1使用圖嵌入推薦

CF通過稀疏的隱式反饋 E + E^+ E+ 學習,旨在獲取協同用戶-物品對應的嵌入 E u ? E_u? Eu?? E i ? E_i? Ei??,以進行推薦。部分推薦系統采用圖神經網絡(GNNs)來建模復雜的高階用戶-物品關系,將 E + E^+ E+ 視為稀疏交互圖的邊。因此,CF 過程可以分為兩個階段:二分圖嵌入和用戶-物品預測。優化協同圖嵌入 E = { E u , E i } E = \{ E_u, E_i \} E={Eu?,Ei?} 的目標是最大化后驗估計,形式化表示如下:
在這里插入圖片描述
其中, p ( E ∣ E + ) p(E|E^+) p(EE+) 的目標是盡可能多地將 E + E^+ E+ 中的用戶-物品關系編碼到 E u ? E_u? Eu?? E i ? E_i? Ei?? 中,以實現準確的用戶-物品預測。

2.2使用輔助信息推薦

為了解決數據稀疏性問題,許多研究引入了形式為節點特征 F F F 的輔助信息,將推薦器編碼器 f Θ ? f_\Theta? fΘ?? 視為特征圖。帶有輔助信息 F F F f Θ f_\Theta fΘ? 的學習過程被表述為最大化后驗估計 p ( Θ ∣ F , E + ) p(\Theta|F, E^+) p(Θ∣F,E+)
在這里插入圖片描述

2.3使用數據增強推薦

盡管將輔助信息引入推薦系統取得了顯著進展,但低質量的輔助信息可能會削弱稀疏交互數據 E + E^+ E+ 的有效性。LLMRec 專注于用戶-物品交互特征圖的增強,這涉及到 LLM 增強的用戶-物品交互邊 E A ? E_A? EA?? 和 LLM 生成的節點特征 F A ? F_A? FA??。增強交互特征圖的優化目標為:
在這里插入圖片描述

3.方法

LLMRec的框架如圖1所示。
在這里插入圖片描述

3.1LLM作為隱式反饋增強器

采用LLM作為知識感知采樣器,從自然語言的角度對用戶-物品(u-i)訓練數據進行成對采樣。具體而言,將每個用戶的歷史交互物品與輔助信息(如年份、類型)以及物品候選池 C u C_u Cu? 輸入到 LLM 中。然后,LLM從 C u ? C_u? Cu?? 中選擇用戶 u u u 可能交互的物品( i u + i^+_u iu+?)或不太可能交互的物品( i u ? i^-_u iu??)。增強用戶-物品交互邊并將其納入訓練數據的過程可以形式化為:
在這里插入圖片描述
其中, i u + , i u ? ? i^+_u, i^-_u? iu+?,iu??? 是 LLM 基于輸入提示 P u U I ?? P^{UI}_u?? PuUI???從候選集 C u ? C_u? Cu?? 中為用戶 u u u 選擇的 BPR 正負樣本,增強數據集 E A ? E_A? EA?? 包含成對訓練三元組 ( u , i u + , i u ? ) (u, i^+_u, i^-_u) (u,iu+?,iu??)。文本的 u-i 增強提示 P u U I ?? P^{UI}_u?? PuUI??? 包含不同的組成部分:i) 任務描述,ii) 歷史交互,iii) 候選物品,以及 iv) 輸出格式描述,如圖 2(a) 所示。
在這里插入圖片描述

3.2基于LLM的輔助信息增強

3.2.1用戶畫像與項目屬性增強

LLM 基于輔助信息增強范式包括兩個步驟:

  1. 用戶/物品信息精煉。通過使用從數據集的交互和輔助信息中衍生的提示,使 LLM 生成不在數據集中的用戶和物品屬性。具體示例見圖 2(b)?。

  2. LLM 增強的語義嵌入。增強后的用戶和物品信息將被編碼為特征,并作為推薦系統的輸入。使用 LLM 作為編碼器提供了高效且先進的語言理解能力,使得用戶交互偏好畫像化并消除物品屬性的偏見。

形式上,基于 LLM 的輔助信息增強如下:
在這里插入圖片描述
其中 f A , u , f A , i ∈ R d L L M ? f_{A,u}, f_{A,i} \in \mathbb{R}^{d_{LLM}}? fA,u?,fA,i?RdLLM?? 是經過 LLM 增強的用戶/物品特征,具有 LLM 的隱藏維度 d L L M d_{LLM} dLLM?。文本提示 P u U ?? P^U_u?? PuU??? P i I ?? P^I_i?? PiI??? 分別用于用戶 u u u 和物品 i i i 的屬性精煉。 A u ? A_u? Au?? A i ? A_i? Ai?? 表示生成的文本屬性,這些屬性將通過 LLM 的嵌入能力編碼為特征 F A , u , F A , i ? F_{A,u}, F_{A,i}? FA,u?,FA,i??

3.2.2輔助信息融合

在獲得用戶/物品的增強輔助信息后,采用以下三個步驟融合信息:

  1. 增強語義投影。使用帶 dropout 的線性層,不僅減少 LLM 增強的語義特征的維度,還將這些增強特征映射到它們自己的空間。

  2. 協同上下文注入。為了將高階協同連接注入到增強特征中,LLMRec 使用輕量級的圖神經網絡作為編碼器。

  3. 語義特征融合。將增強特征 F A ? F_A? FA?? 視為附加組成部分,而不是作為推薦系統的可學習向量的初始化。這允許使用縮放因子和歸一化靈活調整 LLM 增強特征的影響。

形式上, F A ? F_A? FA?? 的融合表示為:
在這里插入圖片描述
最終的預測表示 h u ? h_u? hu?? h i ? h_i? hi?? 位于 R 1 × d \mathbb{R}^{1 \times d} R1×d。用戶畫像為 A u ? A_u? Au??,去偏見的物品屬性為 A i ? A_i? Ai??,原始的多模態輔助信息為 M M M。特征的具體類型為 f k ? f_k? fk??。使用聚合權重 ω 1 ? \omega_1? ω1?? L 2 ? L_2? L2?? 歸一化來調整特征向量,以減輕分布差異,確保額外特征在推薦編碼器中的有效性。

3.3使用去噪穩健機制訓練

3.3.1帶噪聲剪枝的增強優化

本文使用并集 E ∪ E A ? E \cup E_A? EEA?? 訓練推薦系統,通過增加監督信號來優化 BPR 損失,利用整合的 LLM 增強用戶偏好來提升推薦系統的性能:
在這里插入圖片描述
其中,正負樣本對的預測分數通過最終表示 h h h 的內積獲得,樣本數量 ∣ E A ∣ |E_A| EA? 由批量大小 B B B 和比率 ω 3 ? \omega_3? ω3?? 控制。權重衰減正則化 ∥ Θ ∥ 2 \|\Theta\|^2 ∥Θ2 ω 2 ? \omega_2? ω2?? 加權,以減輕過擬合。 σ ( ? ) \sigma(\cdot) σ(?) 是激活函數 sigmoid,用于引入非線性。

為了增強增強數據的有效性,本文選擇剔除不可靠的用戶-項目交互噪聲。具體來說,在每次迭代后,排序后丟棄最大的負值。這有助于優先考慮和強調相關的監督信號,同時減輕噪聲的影響。形式上,帶有噪聲修剪的目標 L B P R ? L_{BPR}? LBPR?? 可以重寫為:
在這里插入圖片描述
其中,函數 SortAscend ( ? ) [ 0 : N ] \text{SortAscend}(\cdot)[0:N] SortAscend(?)[0:N] 對值進行排序并選擇前 N N N 個。保留的數量 N N N N = ( 1 ? ω 4 ) ? ∣ E ∪ E A ∣ N = (1 - \omega_4) \cdot |E \cup E_A| N=(1?ω4?)?EEA? 計算,其中 ω 4 ? \omega_4? ω4?? 是一個比率。該方法允許對損失樣本進行控制性修剪,強調相關信號,同時減少噪聲。這可以避免不可靠的梯度反向傳播的影響,從而使優化過程更加穩定和有效。

3.3.2通過MAE增強語義特征

為了減輕噪聲增強特征的影響,采用掩碼自編碼器MAE進行特征增強。形式上,選擇一個節點子集 e ? V e \subset V e?V 并使用掩碼標記 [MASK] 來掩蓋它們的特征,表示為 f [ MASK ] f[\text{MASK}] f[MASK]。掩碼操作可以表示為:
在這里插入圖片描述
為了增強特征編碼器,引入特征恢復損失 L F R ? L_{FR}? LFR??,通過比較掩碼屬性矩陣與原始增強特征矩陣來實現,帶有一個縮放因子 γ \gamma γ。恢復損失函數 L F R ? L_{FR}? LFR?? 定義為:
在這里插入圖片描述
最終的優化目標是噪聲修剪的 BPR 損失 L B P R ? L_{BPR}? LBPR?? 和特征恢復損失 L F R ? L_{FR}? LFR?? 的加權和。

4.實驗

4.1實驗設置

數據集:ML-10M和Netflix

基線:

  1. 一般CF方法:MFBPR,NGCF和LightGCN

  2. 帶有輔助信息的方法:VBPR,MMGCN和GRCN

  3. 數據增強方法:LATTICE

  4. 自監督方法:CLCRec,MMSSL和MICRO

4.2模型性能

在這里插入圖片描述
結論:

  1. LLMRec整體性能優越:LLMRec通過明確增強用戶-物品交互邊和提高輔助信息的質量,超越了基線模型。

  2. 輔助信息的有效性:輔助信息的整合顯著增強了推薦系統的能力,MMSSL和MICRO的性能優于NGCF。

  3. 不準確的增強對模型的改進有限:LATTICE和MICRO,也利用輔助信息進行數據增強,但與LLMRec相比,改進有限。

  4. 相對于自監督學習方法的優勢:MMSSL和MICRO的自監督模型在通過自監督信號解決稀疏性方面表現優異,然而并未超越LLMRec。

4.3消融實驗

在這里插入圖片描述
結論:

  1. w/o-u-i:禁用 LLM 增強的隱式反饋 E A ? E_A? EA?? 導致性能顯著下降。這表明,LLMRec通過包含上下文知識增加了潛在的監督信號,從而更好地把握用戶偏好。

  2. w/o-u:去除用戶畫像增強器導致性能下降,這表明增強的用戶信息能夠有效地利用歷史交互和物品端知識來總結有用的用戶偏好畫像。

  3. w/o-u&i:去除用戶和物品的增強輔助信息時,推薦準確性下降。這一發現表明,基于LLM的增強信息為推薦系統提供了有價值的增強數據,幫助獲得高質量和信息豐富的表示。

  4. w/o-prune:去除噪聲修剪導致性能下降。這表明去除噪聲隱式反饋信號的過程有助于防止不正確的梯度下降。

  5. w/o-QC:當同時去除對隱式反饋和語義特征質量的限制時,性能受到影響。這表明,通過整合噪聲修剪和語義特征增強,去噪數據魯棒性機制帶來了顯著的好處。

4.4超參數實驗

在這里插入圖片描述
結論:

  1. 溫度系數 τ \tau τ:溫度系數 τ \tau τ 影響文本的隨機性。較高的值(>1.0)增加多樣性和創造性,而較低的值(<0.1)則導致更集中。如表 4 所示,增加 τ \tau τ 最初改善了大多數指標,但隨后出現下降。

  2. Top-p 值 p p p:Top-p 采樣根據由 top-p 參數 p p p 決定的閾值選擇標記。較低的 p p p 值優先考慮可能的標記,而較高的值則鼓勵多樣性。較小的 p p p 值往往能產生更好的結果,可能是因為避免了未列出的候選選擇。較高的 p p p 值則會因重復的 LLM 推理導致標記浪費。

  3. 候選項數量 C C C:使用 C C C 來限制基于 LLM 的推薦的物品候選項。表 5 顯示 C = 10 C = 10 C=10 產生了最佳結果。較小的值限制了選擇,而較大的值則增加了推薦的難度。

5.總結

本研究旨在設計增強LLM的模型,以應對稀疏的隱式反饋信號和低質量輔助信息的挑戰,通過分析用戶互動偏好和去偏見商品屬性來實現。為了確保增強數據的質量,引入了一種去噪增強魯棒性機制。LLMRec 的有效性得到了理論分析和實驗結果的支持,展示了其在基準數據集上優于最先進推薦技術的優勢。未來的研究方向包括將因果推理整合到側信息去偏見中,以及探索上下文感知用戶偏好的反事實因素。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/71475.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/71475.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/71475.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Ubuntu 系統 cuda12.2 安裝 MMDetection3D

DataBall 助力快速掌握數據集的信息和使用方式&#xff0c;會員享有 百種數據集&#xff0c;持續增加中。 需要更多數據資源和技術解決方案&#xff0c;知識星球&#xff1a; “DataBall - X 數據球(free)” 貴在堅持&#xff01; ---------------------------------------…

Tomcat的升級

Tomcat 是一個開源的 Java Servlet 容器&#xff0c;用于部署 Java Servlet 和 JavaServer Pages&#xff08;JSP&#xff09;。隨著新版本的發布&#xff0c;Tomcat 通常會帶來性能改進、安全增強、新特性和對最新 Java 版本的更好支持。升級 Tomcat 服務器通常涉及到以下幾個…

Python常見面試題的詳解10

1. 哪些操作會導致 Python 內存溢出&#xff0c;怎么處理&#xff1f; 要點 1. 創建超大列表或字典&#xff1a;當我們一次性創建規模極為龐大的列表或字典時&#xff0c;會瞬間占用大量的內存資源。例如&#xff0c;以下代碼試圖創建一個包含 10 億個元素的列表&#xff0c;在…

多個用戶如何共用一根網線傳輸數據

前置知識 一、電信號 網線&#xff08;如以太網線&#xff09;中傳輸的信號主要是 電信號&#xff0c;它攜帶著數字信息。這些信號用于在計算機和其他網絡設備之間傳輸數據。下面是一些關于網線傳輸信號的詳細信息&#xff1a; 1. 電信號傳輸 在以太網中&#xff0c;數據是…

華為昇騰 910B 部署 DeepSeek-R1 蒸餾系列模型詳細指南

本文記錄 在 華為昇騰 910B(65GB) * 8 上 部署 DeepSeekR1 蒸餾系列模型&#xff08;14B、32B&#xff09;全過程與測試結果。 NPU&#xff1a;910B3 (65GB) * 8 &#xff08;910B 有三個版本 910B1、2、3&#xff09; 模型&#xff1a;DeepSeek-R1-Distill-Qwen-14B、DeepSeek…

【前端】Vue組件庫之Element: 一個現代化的 UI 組件庫

文章目錄 前言一、官網1、官網主頁2、設計原則3、導航4、組件 二、核心功能&#xff1a;開箱即用的組件生態1、豐富的組件體系2、特色功能亮點 三、快速上手&#xff1a;三步開啟組件化開發1、安裝&#xff08;使用Vue 3&#xff09;2、全局引入3、按需導入&#xff08;推薦&am…

關于uniApp的面試題及其答案解析

我的血液里流淌著戰意&#xff01;力量與智慧指引著我&#xff01; 文章目錄 1. 什么是uniApp&#xff1f;2. uniApp與原生小程序開發有什么區別&#xff1f;3. 如何使用uniApp實現條件編譯&#xff1f;4. uniApp支持哪些平臺&#xff0c;各有什么特點&#xff1f;5. 在uniApp中…

Ubuntu 下 nginx-1.24.0 源碼分析 - ngx_pool_t 類型

ngx_pool_t 定義在 src/core/ngx_core.h typedef struct ngx_pool_s ngx_pool_t; ngx_pool_s 定義在 src/core/ngx_palloc.h struct ngx_pool_s {ngx_pool_data_t d;size_t max;ngx_pool_t *current;ngx_chain_t *chain;ng…

力扣 最長遞增子序列

動態規劃&#xff0c;二分查找。 題目 由題&#xff0c;從數組中找一個最長子序列&#xff0c;不難想到&#xff0c;當這個子序列遞增子序列的數越接近時是越容易拉長的。從dp上看&#xff0c;當遍歷到這個數&#xff0c;會從前面的dp選一個最大的數加上當前數&#xff0c;注意…

Linux | 進程控制(進程終止與進程等待)

文章目錄 Linux | 進程控制 — 進程終止 & 進程等待1、進程終止進程常見退出方法1.1退出碼基本概念獲取退出碼的方式常見退出碼約定使用場景 1.2 strerror函數 & errno宏1.3 _exit函數1.4_exit和exit的區別1.4.1 所屬頭文件與函數原型1.4.2 執行過程差異**結合現象分析…

Android - Handler使用post之后,Runnable沒有執行

問題&#xff1a;子線程創建的Handler。如果 post 之后&#xff0c;在Handler.removeCallbacks(run)移除了&#xff0c;下次再使用Handler.postDelayed(Runnable)接口或者使用post時&#xff0c;Runnable是沒有執行。導致沒有收到消息。 解決辦法&#xff1a;只有主線程創建的…

魚皮面試鴨30天后端面試營

day1 1. MySQL的索引類型有哪些? MySQL里的索引就像是書的目錄&#xff0c;能幫數據庫快速找到你要的數據。以下是各種索引類型的通俗解釋&#xff1a; 按數據結構分 B樹索引&#xff1a;最常用的一種&#xff0c;數據像在一棵樹上分層存放&#xff0c;能快速定位范圍數據…

【核心算法篇十二】《深入解剖DeepSeek多任務學習:共享表示層的24個設計細節與實戰密碼 》

引言:為什么你的模型總在"精神分裂"? 想象你訓練了一個AI實習生: 早上做文本分類時準確率90%下午做實體識別卻把"蘋果"都識別成水果公司晚上做情感分析突然開始輸出亂碼這就是典型的任務沖突災難——模型像被不同任務"五馬分尸"。DeepSeek通…

DeepSeek應用——與PyCharm的配套使用

目錄 一、配置方法 二、使用方法 三、注意事項 1、插件市場無continue插件 2、無結果返回&#xff0c;且在本地模型報錯 記錄自己學習應用DeepSeek的過程&#xff0c;使用的是自己電腦本地部署的私有化蒸餾模型...... &#xff08;舉一反三&#xff0c;這個不單單是可以用…

2025最新智能優化算法:改進型雪雁算法(Improved Snow Geese Algorithm, ISGA)求解23個經典函數測試集,MATLAB

一、改進型雪雁算法 雪雁算法&#xff08;Snow Geese Algorithm&#xff0c;SGA&#xff09;是2024年提出的一種新型元啟發式算法&#xff0c;其靈感來源于雪雁的遷徙行為&#xff0c;特別是它們在遷徙過程中形成的獨特“人字形”和“直線”飛行模式。該算法通過模擬雪雁的飛行…

vscode通過ssh連接服務器實現免密登錄+刪除

文章目錄 參考&#xff1a; 1、 vscode通過ssh連接服務器實現免密登錄刪除&#xff08;吐血總結&#xff09;

MySQL 主從復制原理及其工作過程

一、MySQL主從復制原理 MySQL 主從復制是一種將數據從一個 MySQL 數據庫服務器&#xff08;主服務器&#xff0c;Master&#xff09;復制到一個或多個 MySQL 數據庫服務器&#xff08;從服務器&#xff0c;Slave&#xff09;的技術。以下簡述其原理&#xff0c;主要包含三個核…

【趙渝強老師】Spark RDD的緩存機制

Spark RDD通過persist方法或cache方法可以將計算結果的緩存&#xff0c;但是并不是這兩個方法被調用時立即緩存&#xff0c;而是觸發后面的action時&#xff0c;該RDD才會被緩存在計算節點的內存中并供后面重用。下面是persist方法或cache方法的函數定義&#xff1a; def pers…

設計模式相關知識點

目錄 設計模式 設計模式 代碼設計原則 設計模式 設計模式 干掉if...else&#xff0c;最好用的3種設計模式&#xff01; | 小傅哥 bugstack 蟲洞棧 代碼設計原則-CSDN博客 23種設計模式-CSDN博客 策略模式&#xff08;Strategy Pattern&#xff09;-CSDN博客 責任鏈模式…

ShenNiusModularity項目源碼學習(9:項目結構)

ShenNiusModularity源碼主要有11個project&#xff08;其實還有officialweb、test兩個文件夾&#xff0c;大致有4、5個project&#xff0c;但看著跟主要項目代碼沒太大關系&#xff0c;暫時不管&#xff09;&#xff0c;這11個project的依賴關系如下圖所示&#xff0c;其中最下…