數據挖掘:航空公司的客戶價值分析

需求分析

理解并掌握聚類分析方法,掌握數據的標準化,掌握尋找最佳聚類數,掌握聚類的繪圖,掌握聚類分析的應用場景。

系統實現

實驗流程分析

  • 借助航空公司數據,對客戶進行分類
  • 對不同類別的客戶進行特征分析,比較不同類別客戶的價值
  • 對不同價值的客戶類別進行個性化服務,制定相應的營銷策略

數據準備

  • 加載本次實驗所需要用到的包

打開spyder,輸入以下代碼

import pandas as pd
import numpy as np
from sklearn.metrics import silhouette_score
from sklearn.decomposition import PCA
from sklearn.cluster import KMeans,AgglomerativeClustering
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
import datetime
plt.rcParams['font.sans-serif']=['SimHei']  #中文正常顯示
plt.rcParams['axes.unicode_minus']=False   #讓負號正常顯示
  • 讀取數據,查看數據和整理數據信息

??https:staticfile.eduplus.netldataSetsystemLiblc3b5c0f37fe24797808613bc713d5585.rar。壓縮包中的數據為csv數據,解壓并將該數據移動到c:/數據分析/data目錄中

讀取并查看數據

?

取出SUM_YR_1和SUM_YR_2不為空的樣本
?

去除掉第一年、第二年票價均為0,同時平均折扣系數大于零和飛行里程大于零的數據
?

  • 取出LRFMC模型數據,并整理

取出LRFMC模型數據

計算入會天數?

L = pd.to_datetime(new_data['LOAD_TIME'])-pd.to_datetime(new_data['FFP_DATE'])
L = np.int64(L.astype(str).str.split().str[0])  # 會員入會天數          
L=pd.DataFrame(L,columns=['Days'])
air_features = pd.concat([L, new_data.iloc[:, 2:]], axis=1)   # 橫向拼接
print(air_features.head())

更改列名,描述性統計?

?重置索引

數據標準化

?

尋找最佳聚類個數

  • 繪制拐點圖,尋找下降最劇烈的點
sse=[]
for i in range(2,10):result=KMeans(i,random_state=100).fit(data_scale)sse.append(result.inertia_)
plt.figure()
plt.plot(range(2,10),sse,marker='o')
plt.xlabel('k')
plt.ylabel('sse')
plt.show()

k=3/4時最激烈?

  • 繪制輪廓系數圖,尋找輪廓系數高的點
sil=[]
for i in range(2,8):result=KMeans(i,random_state=100).fit(data_scale)sil.append(silhouette_score(air_features,result.labels_))
plt.figure()
plt.plot(range(2,8),sil,marker='o')
plt.xlabel('k')
plt.ylabel('sil')
plt.show()

?k=2/3輪廓系數最高,綜合k=3

建立聚類模型

  • 繪制聚類圖,觀察聚類情況

kmeans聚類

繪制聚類圖

結果分析

  • 合并數據,并加入分類

  • 聚合各類,對各特征計算平均值

  • 加入客戶分類并畫圖
def customer_type(cluser):if cluser==0:return '重要發展客戶'elif cluser==1:return '最重要客戶'else:return '一般客戶'air_features['客戶類型']=air_features['cluster'].apply(customer_type)
print(air_features.head())

?繪制圖像

customer_count=air_features['客戶類型'].value_counts()
plt.figure()
plt.subplot(1,2,1)
plt.bar(customer_count.index,customer_count.values)
#添加文本
for a,b in zip(customer_count.index,customer_count.values):plt.text(a,b,b,ha='center',va='bottom',color='b')
plt.subplot(1,2,2)
plt.pie(customer_count.values,labels=list(customer_count.index),autopct='%.1f%%', textprops={'color':'r'},shadow=True)
plt.legend(loc=1)
plt.show()

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/715989.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/715989.shtml
英文地址,請注明出處:http://en.pswp.cn/news/715989.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

IEEE754標準的c語言闡述,以及幾個浮點數常量

很多年前,調研過浮點數與整數之間的雙射問題: win7 intel x64 cpu vs2013 c語言浮點數精度失真問題 最近重新學習了一下IEEE754標準,也許實際還有很多深刻問題沒有被揭示。 計算機程序設計藝術,據說這本書中也有討論。 參考&…

電商數據分析13——電商平臺退貨率分析與降低策略

目錄 寫在開頭1. 退貨率分析的重要性1.1 退貨現象的影響1.2 退貨數據的收集與分析 2. 數據分析揭示的主要退貨原因2.1 產品描述不準確2.2 物流配送問題2.3 產品質量問題 3. 基于數據分析的退貨率降低策略3.1 優化產品描述和圖片3.2 改進物流配送服務3.3 加強質量控制和售后服務…

抖音視頻批量采集軟件|視頻評論下載工具

在日常工作中,需要頻繁下載抖音視頻,但逐個復制分享鏈接下載效率太低?別擔心!我們推出了一款專業的抖音視頻批量采集軟件,基于C#開發,滿足您的需求,讓您通過關鍵詞搜索視頻并自動批量抓取&#…

力扣每日一題 受限條件下可到達節點的數目 DFS

Problem: 2368. 受限條件下可到達節點的數目 文章目錄 思路復雜度Code 思路 &#x1f468;?&#x1f3eb; 靈神 復雜度 時間復雜度: O ( n ) O(n) O(n) 空間復雜度: O ( n ) O(n) O(n) Code class Solution {int ans 0;boolean[] set;List<Integer>[] es;publ…

Unity中URP下實現水體(C#動態生成漸變圖)

文章目錄 前言一、Shader部分1、申明水漸變圖紋理和采樣器2、在片元著色器&#xff0c;進行紋理采樣&#xff0c;并且輸出 二、C#腳本部分1、我們新建一個C#腳本2、我們定義兩個變量3、在Start內&#xff0c;new 一個Texture2D(寬&#xff0c;高)4、定義一個Color[寬*高]的顏色…

CCS ‘23 論文清單與摘要

網絡安全學術頂會——CCS 23 論文清單與摘要 1、“Get in Researchers; We’re Measuring Reproducibility”: A Reproducibility Study of Machine Learning Papers in Tier 1 Security Conferences 可復現性對科學的進展至關重要&#xff1b;它增強了對看似矛盾結果的信心&…

企微hook源碼第二彈

免費的企微框架&#xff0c;可下載測試。 支持文本消息&#xff0c;圖片消息&#xff0c;視頻消息&#xff0c;文件消息。 有興趣可以進群交流。649480745&#xff0c;群內不定期開源企微hook源碼 接下來就是第二彈的企微hook源碼。后續會在群內開源完整源碼。

diskMirror-backEnd-spring-boot | diskMirror 后端服務器 SpringBoot 版本!

diskMirror-backEnd-spring-boot 開源技術欄 diskMirror 后端服務器 SpringBoot 版本! 此版本中拓展了 DiskMirrorBackEnd&#xff0c;是一個完全的SpringBoot項目&#xff01; 目錄 diskMirror-backEnd-spring-boot 目錄我如何使用&#xff1f; 部署與配置我如何使用其中的…

Java+SpringBoot+Vue:志愿服務的數字化之旅

??計算機畢業編程指導師 ??個人介紹&#xff1a;自己非常喜歡研究技術問題&#xff01;專業做Java、Python、微信小程序、安卓、大數據、爬蟲、Golang、大屏等實戰項目。 ??實戰項目&#xff1a;有源碼或者技術上的問題歡迎在評論區一起討論交流&#xff01; ?? Java、…

理想汽車狂飆18%,造車新勢力洗牌

2月27日&#xff0c;#理想汽車狂飆18%#話題沖上熱搜&#xff1b;前一日&#xff0c;理想汽車(02015.HK)公布了2023年第四季度及全年財報。盡管其營收凈利雙增長&#xff0c;但業績增長背后仍有隱憂。 「不二研究」據其2023年報發現&#xff1a;2023年&#xff0c;理想汽車研發…

24計算機考研調劑 | 北京聯合大學

北京聯合大學自動駕駛方向招生調劑 考研調劑招生信息 學校:北京聯合大學 專業:工學->電子信息->計算機應用技術 工學->計算機科學與技術 年級:2024 招生人數:10 招生狀態:正在招生中 聯系方式:********* (為保護個人隱私,聯系方式僅限APP查看) 補充內容 研究…

【辦公類-25-01】20240302 UIBOT上傳 ”班級主頁-育兒知識(家園小報)“

作品展示&#xff1a; 一、背景需求&#xff1a; 本學期制作了 “育兒知識&#xff08;家園小報&#xff09;”合并A4內容 【辦公類-22-08】周計劃系列&#xff08;4&#xff09;“育兒知識&#xff08;家園小報&#xff09;“ &#xff08;2024年調整版本&#xff09;-CSDN博…

從圖像中提取特征的過程時,一些常用的用于描述的詞語

提取&#xff08;Extract&#xff09;&#xff1a; 描述模型從輸入數據中獲取關鍵信息或特征的過程。例如&#xff0c;特征提取層可以從原始圖像中提取特定的模式或結構。 捕獲&#xff08;Capture&#xff09;&#xff1a; 表示模型通過學習能夠捕獲圖像中的關鍵信息&#xf…

【論文閱讀】Usenix Security 2023 你看不見我:對基于激光雷達的自動駕駛汽車駕駛框架的物理移除攻擊

文章目錄 一.論文信息二.論文內容1.摘要2.引言3.作者貢獻4.主要圖表5.結論 一.論文信息 論文題目&#xff1a; You Can’t See Me: Physical Removal Attacks on LiDAR-based Autonomous Vehicles Driving Frameworks&#xff08;你看不見我:對基于激光雷達的自動駕駛汽車駕駛…

HCIA-HarmonyOS設備開發V2.0證書

目錄 一、不墨跡&#xff0c;上證書二、考試總結三、習題四、知識點五、堅持就有收獲 HCIA-HarmonyOS Device Developer V2.0 開發者能力認證考試已通過。 一、不墨跡&#xff0c;上證書 一個多月的努力&#xff0c;驗證了自己的學習成果&#xff0c;也認識到自己有待提升之處…

微軟AI文生圖新突破,用于圖像生成的多LoRA組合訓練模型Multi-LoRA-Composition

微軟近期在文本至圖像生成領域取得了一項重要突破&#xff0c;通過引入多重低秩適應&#xff08;LoRA&#xff09;技術&#xff0c;成功地創造出了高度個性化和細節豐富的圖像。這一研究不僅為我們帶來了全新的圖像生成方法&#xff0c;還為我們提供了一種基于GPT-4V的圖像質量…

switch開關語句

定義 單條件多分支的開關語句。 格式定義 switch(表達式) { case 常量值1: 若干個語句 break; ... case 常量值n: 若干個語句 break; default: 若干語句 } ★注意★&#xff1a; ① 表達式的值必須與int兼容類型&#xff1a; byte&#xff0c;short&#xff0c;int&#xff…

柔柔弱弱人人人

? 通用計算機啟動過程 1??一個基礎固件&#xff1a;BIOS 一個基礎固件&#xff1a;BIOS→基本IO系統&#xff0c;它提供以下功能&#xff1a; 上電后自檢功能 Power-On Self-Test&#xff0c;即POST&#xff1a;上電后&#xff0c;識別硬件配置并對其進行自檢&#xff0c…

django項目中使用ON DUPLICATE KEY UPDATE 來進行數據庫批量插入

如果在遇到property_index字段沖突時更新其他所有字段&#xff0c;使其在ON DUPLICATE KEY UPDATE子句中明確指定除了property_index以外的所有字段應該如何更新。這意味著你需要構建一個更新賦值的列表&#xff0c;其中不包括property_index字段。 from django.db import con…

【RISC-V 指令集】RISC-V DSP 擴展指令集介紹(一)

前言&#xff1a; 本筆記是基于對RISC-V DSP擴展指令集文檔總結的&#xff0c;《P-ext-proposal.pdf》文檔的關鍵內容如下&#xff1a; 主要介紹了RISC-V的P擴展指令集及其相關細節。 首先&#xff0c;對P擴展指令進行了概述&#xff0c;并列出了其與其他擴展重復的指令。 …