【推薦算法】注意力機制與興趣演化:推薦系統如何抓住用戶的心?

注意力機制與興趣演化:推薦系統如何抓住用戶的心?

      • 一、算法背景知識:從靜態推薦到動態感知
        • 1.1 傳統推薦系統的局限性
        • 1.2 人類注意力機制的啟示
      • 二、算法理論/結構:動態興趣建模革命
        • 2.1 DIN(深度興趣網絡):注意力機制初探
        • 2.2 DIEN(深度興趣演化網絡):序列建模進階
      • 三、模型評估:業務效果的飛躍
        • 3.1 離線實驗(淘寶數據集)
        • 3.2 在線A/B測試(淘寶雙十一)
      • 四、應用案例:電商推薦實戰
        • 4.1 淘寶首頁推薦
        • 4.2 短視頻推薦
      • 五、面試題與論文資源
        • 5.1 高頻面試題
        • 5.2 關鍵論文
      • 六、詳細優缺點分析
        • 6.1 技術優勢
        • 6.2 挑戰與解決方案
      • 七、相關算法演進
        • 7.1 注意力機制家族
        • 7.2 興趣建模技術對比
        • 7.3 工業演進路線
      • 總結:從"千人一面"到"千人千時"

一、算法背景知識:從靜態推薦到動態感知

1.1 傳統推薦系統的局限性

在2017年之前,主流推薦系統(如矩陣分解、DeepFM)存在兩大根本缺陷:

  1. 靜態興趣假設:認為用戶興趣是固定不變的

    • 用戶表征向量 u \mathbf{u} u一旦生成即固定
    • 無法反映"早上看新聞,晚上購物的"的時序變化
  2. 平等對待歷史行為
    u = 1 T ∑ t = 1 T e t \mathbf{u} = \frac{1}{T}\sum_{t=1}^T \mathbf{e}_t u=T1?t=1T?et?
    所有歷史行為 e t \mathbf{e}_t et?被同等對待,忽略了:

    • 近期行為比早期更重要
    • 與當前場景相關的行為更關鍵
1.2 人類注意力機制的啟示

心理學研究表明:

  • 選擇性注意:人類只會關注視覺場中約4%的信息
  • 興趣漂移:用戶興趣隨時間呈指數衰減:
    I ( t ) = I 0 e ? λ t I(t) = I_0 e^{-\lambda t} I(t)=I0?e?λt

💡 阿里團隊發現:電商用戶點擊行為中,僅15%的歷史行為與當前決策真正相關

在這里插入圖片描述

二、算法理論/結構:動態興趣建模革命

在這里插入圖片描述

2.1 DIN(深度興趣網絡):注意力機制初探

阿里2017年提出首個注意力推薦模型:

用戶行為序列
Embedding層
目標物品
注意力激活單元
加權行為表示
MLP預測層

注意力權重計算
α t = exp ? ( v T ReLU ( W [ e t ; e a ] ) ) ∑ j = 1 T exp ? ( v T ReLU ( W [ e j ; e a ] ) ) \alpha_t = \frac{\exp(\mathbf{v}^T \text{ReLU}(\mathbf{W}[\mathbf{e}_t;\mathbf{e}_a]))}{\sum_{j=1}^T \exp(\mathbf{v}^T \text{ReLU}(\mathbf{W}[\mathbf{e}_j;\mathbf{e}_a]))} αt?=j=1T?exp(vTReLU(W[ej?;ea?]))exp(vTReLU(W[et?;ea?]))?

  • e t \mathbf{e}_t et?:歷史行為 t t t的嵌入
  • e a \mathbf{e}_a ea?:目標廣告的嵌入
  • W , v \mathbf{W}, \mathbf{v} W,v:可學習參數

用戶表征生成
u = ∑ t = 1 T α t e t \mathbf{u} = \sum_{t=1}^T \alpha_t \mathbf{e}_t u=t=1T?αt?et?

2.2 DIEN(深度興趣演化網絡):序列建模進階

阿里2018年引入時間序列建模:

行為序列
行為序列層
興趣抽取層-GRU
興趣進化層-AUGRU
MLP預測

關鍵創新

  1. 興趣抽取層
    h t = GRU ( e t , h t ? 1 ) \mathbf{h}_t = \text{GRU}(\mathbf{e}_t, \mathbf{h}_{t-1}) ht?=GRU(et?,ht?1?)
    提取每個時間步的即時興趣

  2. 興趣進化層(AUGRU)
    h ~ t = ( 1 ? α t ) h t ? 1 + α t h ~ t \tilde{\mathbf{h}}_t = (1-\alpha_t)\mathbf{h}_{t-1} + \alpha_t \tilde{\mathbf{h}}_t h~t?=(1?αt?)ht?1?+αt?h~t?
    其中 α t \alpha_t αt?是注意力權重,實現興趣的動態演化

三、模型評估:業務效果的飛躍

3.1 離線實驗(淘寶數據集)
模型AUCGAUCRIG
Base模型0.6210.5990.0%
DIN0.683 (+10.0%)0.657 (+9.7%)16.2%
DIEN0.712 (+14.7%)0.689 (+15.0%)23.8%

RIG(Relative Information Gain):信息增益相對值

3.2 在線A/B測試(淘寶雙十一)
指標Base模型DINDIEN
CTR2.15%2.58%2.83%
GMV/UV¥89.6¥105.2¥118.7
新用戶轉化率1.02%1.31%1.49%

四、應用案例:電商推薦實戰

4.1 淘寶首頁推薦
  • 特征工程
    用戶特征
    基礎畫像/實時行為
    商品特征
    類目/價格/店鋪
    DIEN模型
  • 序列建模
    • 行為序列長度:最長500個行為
    • 時間窗口:最近30天
  • 效果:雙十一GMV增加37億元
4.2 短視頻推薦
  • 創新應用:多模態注意力
    α t = f ( 視頻幀 t , 當前視頻 ) \alpha_t = f(\text{視頻幀}_t, \text{當前視頻}) αt?=f(視頻幀t?,當前視頻)
  • 架構優化
    • 使用Transformer替代GRU
    • 在線興趣更新延遲<200ms
  • 成效:觀看時長提升41%

五、面試題與論文資源

5.1 高頻面試題
  1. Q:DIN與DIEN的核心區別?
    A:DIN靜態加權歷史行為,DIEN用序列模型建模興趣演化過程

  2. Q:注意力權重計算為何使用兩層網絡?
    A:增加非線性表達能力:
    α = σ ( v T tanh ? ( W [ e t ; e a ] ) ) \alpha = \sigma(\mathbf{v}^T \tanh(\mathbf{W}[\mathbf{e}_t;\mathbf{e}_a])) α=σ(vTtanh(W[et?;ea?]))

  3. Q:AUGRU相比傳統GRU的優勢?
    A:通過注意力門控實現興趣強度的動態調整:
    h ~ t = ( 1 ? α t ) h t ? 1 + α t h t \tilde{\mathbf{h}}_t = (1-\alpha_t)\mathbf{h}_{t-1} + \alpha_t \mathbf{h}_t h~t?=(1?αt?)ht?1?+αt?ht?

  4. Q:如何處理長序列訓練效率?
    A:采用負采樣+課程學習,逐步增加序列長度

5.2 關鍵論文
  1. DIN原論文:Deep Interest Network (KDD 2018)
  2. DIEN原論文:Deep Interest Evolution Network (AAAI 2019)
  3. 注意力機制:Attention Is All You Need
  4. 工業實踐:Behavior Sequence Transformer

六、詳細優缺點分析

6.1 技術優勢
  1. 動態興趣捕獲

    • 用戶興趣隨時間變化:
    運動鞋
    手機
    咖啡機
    嬰兒奶粉
  2. 關鍵行為聚焦

    行為注意力權重
    瀏覽手機0.38
    購買耳機0.41
    瀏覽衣服0.05
    查看零食0.16
  3. 業務指標提升

    • 淘寶:點擊率提升20-25%
    • 亞馬遜:轉化率提升18%
6.2 挑戰與解決方案
  1. 計算復雜度高

    • 問題:序列建模使訓練耗時增加3-5倍
    • 方案:使用CUDA優化的GRU算子
  2. 長尾興趣捕捉

    • 問題:低頻興趣被高頻行為淹沒
    • 方案:逆頻率加權損失函數
      L = ? ∑ 1 p ( y i ) y i log ? y ^ i \mathcal{L} = -\sum \frac{1}{p(y_i)} y_i \log \hat{y}_i L=?p(yi?)1?yi?logy^?i?
  3. 在線服務延遲

    • 問題:實時序列推理延遲>100ms
    • 方案:興趣狀態緩存+增量更新

七、相關算法演進

7.1 注意力機制家族
模型創新點應用場景提出年份
DIN基礎注意力電商推薦2017
DIEN興趣演化電商/視頻2018
BSTTransformer行為序列2019
SIM長序列建模搜索推薦2020
7.2 興趣建模技術對比
技術代表模型核心思想優勢
靜態池化DeepFM平均/最大池化計算高效
基礎注意力DIN目標相關加權動態聚焦
序列建模DIEN時間演化建模捕捉趨勢
多興趣MIND興趣解耦多樣性
7.3 工業演進路線
DIN
DIEN
BST
SimDIN

總結:從"千人一面"到"千人千時"

注意力機制與興趣演化模型的核心突破在于:

  1. 認知科學的工程化

    • 將人類注意力機制數學化為 α = f ( e t , e a ) \alpha = f(\mathbf{e}_t, \mathbf{e}_a) α=f(et?,ea?)
    • 興趣漂移建模為 h t = AUGRU ( h t ? 1 , e t ) \mathbf{h}_t = \text{AUGRU}(\mathbf{h}_{t-1}, \mathbf{e}_t) ht?=AUGRU(ht?1?,et?)
  2. 業務價值的飛躍

    • 淘寶:年GMV增長超百億
    • YouTube:觀看時長提升40%+
  3. 技術范式的變革

    靜態表征
    動態興趣
    實時演化
    元宇宙虛擬人

🌟 未來方向

  • 多模態興趣建模:融合視覺/語音/文本信號
  • 因果興趣推斷:區分真實興趣與曝光偏差
  • 聯邦興趣學習:隱私保護下的個性化

在這里插入圖片描述

正如DIEN論文所述:“Modeling the evolutionary nature of user interests is the key to capturing the dynamic preference patterns” —— 理解用戶興趣的動態本質,正是推薦系統抓住人心的關鍵所在。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/83779.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/83779.shtml
英文地址,請注明出處:http://en.pswp.cn/web/83779.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

快速入門:創建 Azure 數據資源管理器群集和數據庫

前言 Azure 數據資源管理器是 Microsoft 提供的一項快速、完全托管的數據分析服務。 它允許用戶分析來自應用程序、網站、物聯網設備等的海量數據流,從而簡化復雜的數據探索。 它能夠處理數 PB 的數據,并支持快速檢索數據以進行分析。 主要特點 高性能:ADX 針對快速數據提…

Redis集群模式之Redis Cluster(2)

上篇文章我們講解了Redis Cluster中的主要模塊和兩種重定向方式&#xff0c;這篇文章我們來講解一下Redis Cluster的狀態監測和維護。 Redis Cluster狀態監測及維護 要講解Redis Cluster中節點的狀態如何維護&#xff0c;我們要先知道Redis Cluster中的節點有哪些狀態&#xf…

Step-Audio-AQAA 解讀:邁向「純語音」交互的端到端 LALM 新里程

引言:AI 從聽到說 大型音頻語言模型(Large Audio-Language Models, LALMs)正在徹底改變我們與機器交互的方式。我們不再滿足于簡單的文本問答,而是期望 AI 能夠像人類一樣,通過自然的語音進行交流,理解我們的意圖,并以富有表現力的聲音回應。然而,構建一個能夠直接從語…

基于邊緣計算的絲桿狀態實時監測系統設計?

基于邊緣計算的絲桿狀態實時監測系統設計&#xff0c;可從系統架構、各層功能設計、關鍵技術應用等方面入手&#xff0c;以下為詳細介紹&#xff1a; 系統架構設計 基于邊緣計算的絲桿狀態實時監測系統通常由感知層、邊緣層和云端三部分組成。感知層負責數據采集&#xff0c;…

LeetCode 每日一題 2025/6/9-2025/6/15

記錄了初步解題思路 以及本地實現代碼&#xff1b;并不一定為最優 也希望大家能一起探討 一起進步 目錄 6/9 440. 字典序的第K小數字6/10 3442. 奇偶頻次間的最大差值 I6/11 3445. 奇偶頻次間的最大差值 II6/12 3423. 循環數組中相鄰元素的最大差值6/13 2616. 最小化數對的最大…

PyTorch張量操作中dim參數的核心原理與應用技巧:

今天在搭建神經網絡模型中重寫forward函數時&#xff0c;對輸出結果在最后一個維度上應用 Softmax 函數&#xff0c;將輸出轉化為概率分布。但對于dim的概念不是很熟悉&#xff0c;經過查閱后整理了一下內容。 PyTorch張量操作精解&#xff1a;深入理解dim參數的維度規則與實踐…

Day 31

1. 規范的文件命名 核心原則&#xff1a; 清晰明確&#xff1a;文件名應準確描述內容&#xff08;如data_preprocessing.py&#xff09; 風格統一&#xff1a; 推薦小寫下劃線&#xff08;Python慣例&#xff0c;如model_training.py&#xff09; 或使用駝峰式&#xff08…

學習Oracle------認識VARCHAR2

學習Oracle------認識VARCHAR2 VARCHAR2 是 Oracle 數據庫中專門用于存儲可變長度字符串的數據類型&#xff0c;它是 Oracle 對標準 SQL 數據類型 VARCHAR 的增強和替代。以下是全面解析&#xff1a; 核心概念 名字含義&#xff1a; VAR Variable&#xff08;可變&#xff09…

記錄jackson解析出錯

Jackson 屬性名大小寫 Bug 記錄 問題描述 在前后端交互過程中&#xff0c;前端傳遞的 JSON 字段名為駝峰風格&#xff08;如 qTitle&#xff09;&#xff0c;后端 Java 實體類字段名也為駝峰&#xff08;如 private String qTitle;&#xff09;。 但在反序列化時&#xff0c;…

泰國數碼電商系統定制|3C產品詳情泰語化+售后管理,適配泰國數碼零售

隨著全球數字化的加速&#xff0c;電商行業正在迅速發展&#xff0c;尤其是以泰國為代表的東南亞市場。泰國不僅是一個擁有龐大消費者群體的市場&#xff0c;而且其日益增長的互聯網使用率和手機普及率使得數碼產品的銷售潛力巨大。在這樣的大背景下&#xff0c;針對泰國市場的…

59、定制化原理-SpringBoot定制化組件的幾種方式

59、定制化原理-SpringBoot定制化組件的幾種方式 在Spring Boot中&#xff0c;定制化組件的方式多樣&#xff0c;以下是幾種常見的方法及其原理&#xff1a; #### 修改配置文件 通過修改application.properties或application.yml文件&#xff0c;利用ConfigurationProperties注…

機器學習--分類

陽性&#xff08;Positive&#xff09;和陰性&#xff08;Negative&#xff09; 陽性&#xff08;Positive&#xff09; 正類&#xff1a;通常指的是我們關注的類別或事件&#xff1b;陰性&#xff08;Negative&#xff09; 負類&#xff1a; 指的是與陽性相反的類別或事件。…

三星MZQL2960HCJR-00BAL高性能固態硬盤控制器SSD云計算和高端存儲專用 電子元器件解析

MZQL2960HCJR-00BAL 電子元器件解析 1. 基本類型與功能 MZQL2960HCJR-00BAL 是 三星&#xff08;Samsung&#xff09; 推出的一款 企業級NVMe SSD主控芯片&#xff0c;屬于 高性能固態硬盤控制器&#xff0c;專為 數據中心、云計算和高端存儲 設計。 關鍵特性&#xff1a; 接…

Blender——建構、粒子、燈光、動畫

Blender是一款開源的三維建模和動畫軟件&#xff0c;可用于創建3D模型、動畫、渲染圖像和視頻&#xff0c;還支持雕刻、紋理繪制、粒子系統等功能。 建構篇&#xff1a; 基本操作&#xff1a; 視角的控制&#xff1a; 控制觀察視角: 鼠標中鍵 平移視圖: Shift鼠標中鍵 縮放視…

節日快樂啊

<section data-role"paragraph" class"_135editor"> <p> <br/> </p> </section> <p> 瑪哈特2025中國國際金屬成形展覽會邀請函 </p><style>* { margin: 0; …

PHP和Node.js哪個更爽?

先說結論&#xff0c;rust完勝。 php&#xff1a;laravel&#xff0c;swoole&#xff0c;webman&#xff0c;最開始在蘇寧的時候寫了幾年php&#xff0c;當時覺得php真的是世界上最好的語言&#xff0c;因為當初活在舒適圈里&#xff0c;不愿意跳出來&#xff0c;就好比當初活在…

LeetCode - 387. 字符串中的第一個唯一字符

題目 387. 字符串中的第一個唯一字符 - 力扣&#xff08;LeetCode&#xff09; 思路 用哈希表統計每個字符出現的次數 創建一個 unordered_map<char, int>&#xff0c;遍歷字符串&#xff0c;把每個字符出現的次數存進去。 再遍歷字符串&#xff0c;找到第一個只出現…

python從環境變量和配置文件中獲取配置參數

前言 從環境變量和配置文件中獲取配置參數&#xff0c;相關庫&#xff1a; python-dotenv&#xff1a;第三方庫&#xff0c;需要使用pip安裝configparser&#xff1a;標準庫 代碼 test.ini [mysql] host "192.168.0.10" port 3306 user "root" pas…

HarmonyOS5 運動健康app(一):健康飲食(附代碼)

一、核心數據模型設計 代碼通過兩個接口構建了飲食管理的基礎數據結構&#xff1a; interface footItem {name: string; // 營養名稱&#xff08;蛋白質/碳水/脂肪&#xff09;weight: number; // 重量&#xff08;克&#xff09; }interface DietItem {name: string; // 食物…

MQ選型及RocketMQ架構總覽

一、什么是MQ MQ&#xff08;MessageQueue&#xff09; Message(消息)&#xff1a;消息是在不同進程之間傳遞的數據&#xff0c;這些進程可以在同一臺機器上&#xff0c;也可以在不同的機器上。 Queue&#xff08;隊列&#xff09;&#xff1a;隊列原意是指一種具有FIFO&#…