數據產品(2)用戶畫像數據分析模型

目錄

  • 1 用戶畫像
  • 2 RFM模型 (用戶價值分群模型)
  • 3 PSM 價格敏感度
  • 4 精細化運營

1 用戶畫像

也稱用戶表標簽,是基于用戶行為分析獲得的對用戶的一種認知表達,即用戶數據標簽化,通過收集與分析用戶的用戶屬性(年齡、性別、城市、職業、設備、狀態)、用戶偏好(購物偏好,聽歌偏好、訪問時間偏好)、用戶行為(近N日行為、消費行為、售后行為、累計行為:購物金額訂單數客單價)、用戶分層(rfm、會員分層、生命周期、預流失模型、活躍分層、消費分層)等,抽象出一個用戶的全貌。
各類應用推薦場景

2 RFM模型 (用戶價值分群模型)

用于判斷用戶價值度,通過三個指標進行綜合分析,可以將客戶分為不同的類別,如高價值客戶、重要挽留客戶、低價值客戶等,從而方便市場業務部門根據不同的客戶群體制定相應的營銷策略,以實現低成本高回收。

Recency 越小越好:最近一次消費距今多久(消費周期的標簽)7天作為閾值,小于7天或者大于等于7天
Frequency 越大越好:某段時間內消費頻率或次數:半年為周期,小于25次大于等于25次
Monetary 越大越好:某段時間內消費金額:半年為周期,小于2000大于等于2000
都是按照用戶ID進行分組,按照相應的指標進行聚合

RFM模型的作用:
RFM模型作用
RFM模型的作用
RFM如何使用
每個維度劃分兩個區間:2^3=8組
每個維度劃分三個區間:3^3=27組
每個維度劃分五個區間:5^5=125組

RFM使用場景
M需要有消費、F需要有一定的頻次,頻次還需要有區分度、R最近半年/一年用戶需要出現過
外賣/打車/電商

RFE(RFM變種)
Engae:參與度、瀏覽、收藏、點贊、評論、彈幕、分享
瀏覽*1 收藏*2 點贊*3 評論*4 彈幕*5 分享*6
適用于信息流產品:微博、今日頭條、朋友圈、短視頻、抖快

RFM計算流程

1.第一步,以用戶為分組,
R:使用from_unixtime函數將時間戳轉化成日期格式并使用max函數計算出每個用戶最新的消費時間
F:使用counDistinct函數計算出每個用戶不同訂單的訂單總數,
M:sum計算出每個用戶所有訂單金額之和
2.第二步:把每個維度劃分為5個區間,在1-5之間打分,根據制定的打分標準使用when函數和otherwise函數為每個用戶打分,打分標準可以使用describe()函數計算出最大值和最小值去指定,需要注意的是,消費周期這個是時間越短分數越高,如果when的條件是多個,需要用&符號連接
3.第三步:提前計算出三個維度分數平均分,把用戶R F M三個維度的分數和三個維度的平均分數進行比較,把每個維度劃分為兩個區間比較,如果用戶分數大于等于平均分就是 1 這個區間,反之就是 0,然后使用withColumn函數添加R F M三個維度計算出的區間也就是0和1合并為RFM的列
4.第四步:把得到的RFM列和5級標簽的rule使用join連接,進行規則匹配,從而得出每位用戶RFM標簽

       # 1.根據用戶id分別計算RFM的原始值esDF2:DataFrame=esDF.groupby('memberid').agg(F.datediff(F.date_sub(F.current_date(),1027),F.from_unixtime(F.max('finishtime'))).alias('recency'),F.countDistinct('ordersn').alias('frequency'),F.sum('orderamount').alias('monetary'))# esDF2.show()# +--------+-----+---------+------------------+# | memberid | recency | frequency | monetary |# +--------+-----+---------+------------------+# | 29 | 60 | 246 | 403524.2501525879 |# | 474 | 60 | 105 | 203666.499929199 |# esDF2.describe().show()# +-------+------------------+-------------------+------------------+--------------------+# |summary|          memberid|            recency|         frequency|            monetary|# +-------+------------------+-------------------+------------------+--------------------+# |  count|               950|                950|               950|                 950|# |   mean|             475.5|   60.0178947368421|126.44736842105263|   366299.1070466518|# | stddev|274.38567746877766|0.14035852584856298| 39.00137616686665|  3276502.4657239863|# |    min|                 1|                 60|                81|  114856.25006103516|# |    max|               950|                 62|               355|1.0018663619982529E8|# +-------+------------------+-------------------+------------------+--------------------+# 2.每個維度分成5份,根據業務規則標準打分# R 0~30 5 31~60 4 61~90 3 91~140 2 141 1recency = F.when(esDF2.recency <= 30, 5) \.when((esDF2.recency >= 31) & (esDF2.recency <= 60), 4) \.when((esDF2.recency >= 61) & (esDF2.recency <= 90), 3) \.when((esDF2

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/94310.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/94310.shtml
英文地址,請注明出處:http://en.pswp.cn/web/94310.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

03_數據結構

第3課&#xff1a;數據結構 課程目標 掌握Python的基本數據結構&#xff1a;列表、元組、字典、集合學習字符串的高級操作方法理解不同數據結構的特點和適用場景 1. 列表&#xff08;List&#xff09; 1.1 列表的創建和基本操作 # 創建列表 fruits ["蘋果", "香…

【JavaEE】多線程 -- CAS機制(比較并交換)

目錄CAS是什么CAS的應用實現原子類實現自旋鎖ABA問題ABA問題概述ABA問題引起的BUG解決方案CAS是什么 CAS (compare and swap) 比較并交換&#xff0c;CAS 是物理層次支持程序的原子操作。說起原子性&#xff0c;這就設計到線程安全問題&#xff0c;在代碼的層面為了解決多線程…

The United Nations Is Already Dead

The United Nations Is Already Dead When children in Gaza rummage through rubble for food, when UN-run schools are reduced to dust, when the Security Council cannot even pass the mildest ceasefire resolution—blocked by a single veto— we must confront a br…

Kubernetes v1.34 前瞻:資源管理、安全與可觀測性的全面進化

預計正式發布&#xff1a;2025年8月底 | 分類&#xff1a;Kubernetes 隨著2025年8月底的臨近&#xff0c;Kubernetes社區正緊鑼密鼓地準備下一個重要版本——v1.34的發布。本次更新并非簡單的功能疊加&#xff0c;而是在資源管理、安全身份、可觀測性和工作負載控制等核心領域的…

用 Bright Data MCP Server 構建實時數據驅動的 AI 情報系統:從市場調研到技術追蹤的自動化實戰

前言 本文通過兩個真實場景&#xff08;云服務商對比與 AIGC 技術追蹤&#xff09;&#xff0c;展示了如何使用 Bright Data MCP Server 與 Lingma IDE 構建一個具備實時網頁數據抓取、結構化分析與自動化報告生成能力的 AI 工作流。通過簡單的 API 調用與 JSON 配置&#xff…

牛頓第二定律的所有表達方式:1、線性表達 2、圓形表達 3、雙曲線表達 4、拋物線表達5、數列表達

牛頓第二定律是經典力學中的核心定律&#xff0c;表述為&#xff1a;物體的加速度與所受合力成正比&#xff0c;與質量成反比&#xff0c;方向與合力方向相同。其基本矢量形式為&#xff1a; F?ma? \vec{F} m \vec{a} Fma 其中&#xff0c;F?\vec{F}F 是合力&#xff08;單…

【開發日記】SpringBoot 實現支持多個微信小程序的登錄

在實際業務場景中&#xff0c;需要一個后臺同時支持多個微信小程序的登錄。例如&#xff0c;企業有多個不同業務的小程序&#xff0c;但希望統一在同一個后臺系統里進行用戶認證和數據處理。這時候&#xff0c;我們就需要一個靈活的方式來管理多個小程序的 appid 和 secret&…

Docker 容器(一)

Docker一、Docker是什么1.什么是Docker2.Docker特點3.比較虛擬機和容器二、Docker安裝1.Docker??三大核心組件??2.安裝步驟&#xff08;Ubuntu&#xff09;3.阿里云鏡像加速三、Docker鏡像1.什么是鏡像2.UnionFS&#xff08;聯合文件系統&#xff09;3.Docker鏡像加載原理4…

容器安全實踐(二):實踐篇 - 從 `Dockerfile` 到 Pod 的權限深耕

在上一篇《容器安全實踐&#xff08;一&#xff09;&#xff1a;概念篇》中&#xff0c;我們深入探討了容器安全的底層原理&#xff0c;并糾正了“容器天生安全”的誤解。我們了解了 root 用戶的雙重身份&#xff0c;以及特權容器的危險性。 然而&#xff0c;僅僅了解這些概念…

c#_數據持久化

數據持久化架構 數據是應用程序的命脈。持久化架構的選擇直接決定了應用的性能、可擴展性、復雜度和維護成本。本章將深入探討.NET生態中主流的數據訪問模式、工具和策略&#xff0c;幫助你為你的系統做出最明智的數據決策。5.1 ORM之爭&#xff1a;Entity Framework Core深度剖…

996引擎-骰子功能

996引擎-骰子功能 測試NPC QF回調函數 結果 參考資料 在測試NPC播放骰子動畫。 播放前需要先設置骰子點數 測試NPC [[骰子的顯示順序和點數 對應 私人變量 D0 D1 D2 D3 D4 D5]] -- NPC入口函數 function main(player)-- 骰子共6個,設置骰子點數后,再執行搖骰子,否則沒動畫…

Vue 3多語言應用開發實戰:vue-i18n深度解析與最佳實踐

&#x1f4d6; 概述 Vue 3 國際化&#xff08;i18n&#xff09;是構建多語言應用的核心需求。本文檔介紹 Vue 3 中實現國際化的主流方案&#xff0c;包括 vue-i18n、Vite 插件方案和自定義解決方案。 &#x1f3af; 主流方案對比 方案優點缺點適用場景vue-i18n功能完整、生態成…

港口船舶流量統計準確率↑27%!陌訊多模態融合算法實戰解析

一、行業痛點&#xff1a;港口船舶流量統計的三大核心難題智慧港口建設中&#xff0c;船舶流量統計是泊位調度、航道管理與安全預警的核心數據支撐&#xff0c;但傳統方案受場景特性限制&#xff0c;長期存在難以解決的技術瓶頸。據《2023 年中國港口智能化發展報告》顯示&…

Shell腳本的基礎知識學習

Shell 腳本是 Linux/Unix 系統的核心自動化工具&#xff0c;能夠完成以下任務&#xff1a; &#xff08;1&#xff09;批量操作&#xff1a;一鍵安裝軟件、批量處理文件&#xff08;重命名、壓縮、備份等&#xff09;。 &#xff08;2&#xff09;系統管理&#xff1a;監控資源…

k8s部署,pod管理,控制器,微服務,集群儲存,集群網絡及調度,集群認證

k8s部署 k8s中容器的管理方式 ? Kubernetes集群創建方式 centainerd 默認情況下&#xff0c;K8S在創建集群時使用的方式 docker docker使用的普記錄最高&#xff0c;雖然K8S在1.24版本后已經費力了kubelet對docker的支持&#xff0c;但時可以借助cri-docker方式來實現集…

JAVA限流方法

在 Java 項目中限制短時間內的頻繁訪問&#xff08;即接口限流&#xff09;&#xff0c;是保護系統資源、防止惡意攻擊或高頻請求導致過載的重要手段。常見實現方案可分為單機限流和分布式限流&#xff0c;以下是具體實現方式&#xff1a;一、核心限流算法無論哪種方案&#xf…

性能比拼: .NET (C#) vs. Fiber (Go)

本內容是對知名性能評測博主 Anton Putra .NET (C#) vs. Fiber (Go): Performance (Latency - Throughput - Saturation - Availability) 內容的翻譯與整理, 有適當刪減, 相關指標和結論以原作為準 在本視頻中&#xff0c;我們將對比 C# 與 .NET 框架和 Golang 的表現。在第一個…

信譽代幣的發行和管理機制是怎樣的?

信譽代幣的發行與管理機制是區塊鏈技術與經濟模型深度融合的產物&#xff0c;其核心在于通過代碼和社區共識構建可量化、可驗證的信任體系。以下從技術架構、經濟模型、治理機制三個維度展開分析&#xff0c;并結合具體案例說明&#xff1a;一、發行機制&#xff1a;行為即價值…

神經網絡|(十二)概率論基礎知識-先驗/后驗/似然概率基本概念

【1】引言 前序學習進程中&#xff0c;對貝葉斯公式曾經有相當粗糙的回歸&#xff0c;實際上如果我們看教科書或者網頁&#xff0c;在講貝葉斯公式的時候&#xff0c;會有幾個名詞反復轟炸&#xff1a;先驗概率、后驗概率、似然概率。 今天就來把它們解讀一下&#xff0c;為以…

使用UE5開發《紅色警戒3》類戰略養成游戲的硬件配置指南

從零開始&#xff0c;學習 虛幻引擎5&#xff08;UE5&#xff09;&#xff0c;開始游戲開發之旅&#xff01;本文章僅提供學習&#xff0c;切勿將其用于不法手段&#xff01;開發類似《紅色警戒3》級別的戰略養成游戲&#xff0c;其硬件需求遠超普通2D或小型3D項目——這類游戲…