銀行信用卡風險大數據分析與挖掘2024

銀行信用卡風險大數據分析與挖掘

使用excel數據挖掘功能完成

一、信用卡客戶信用等級影響因素分析與挖掘

基于客戶信用記錄表

1. 數據預處理

瀏覽數據
  • 客戶等級占比,其中優質客戶占比較少,風險客戶很多,分析影響客戶信用等級的原因

    在這里插入圖片描述

  • 年齡分布,為了方便挖掘,后續會重新標記為30歲以下,30-50,50歲以上

    在這里插入圖片描述

  • 婚姻狀態,有一個離散值

    在這里插入圖片描述

  • 戶籍分布,分為特別發達、一般和偏遠

    在這里插入圖片描述

  • 教育程度,后續會重新標記為是否上過大學

    在這里插入圖片描述

  • 住房類型,其他影響挖掘,后續會當作離散值刪除

    在這里插入圖片描述

  • 職業類別

    在這里插入圖片描述

  • 工作年限,將20年以上的標記為一類

在這里插入圖片描述

  • 個人收入 收入差距太大了

在這里插入圖片描述

可以看到部分人的收入過高,部分人過低

在這里插入圖片描述

在這里插入圖片描述

  • 保險繳納

在這里插入圖片描述

  • 車輛情況

    在這里插入圖片描述

  • 信用評分

    在這里插入圖片描述

  • 額度

在這里插入圖片描述

  • 審批結果

在這里插入圖片描述

離群值清除
  • 婚姻狀態,選擇將一個喪偶人士的數據清除

    在這里插入圖片描述

在這里插入圖片描述

  • 住房類型

    在這里插入圖片描述

在這里插入圖片描述

重新標記
  • 年齡 重新標記為低于30、30-50、大于50

    在這里插入圖片描述在這里插入圖片描述

  • 戶籍

    在這里插入圖片描述

  • 教育程度

    在這里插入圖片描述

  • 工作年限

    在這里插入圖片描述

采用突出顯示異常值處理

異常值報表

在這里插入圖片描述

異常值數據,共36條

在這里插入圖片描述

選擇刪除異常值

數據處理結果

在這里插入圖片描述

2. 數據挖掘

采用分類中決策樹構建模型,判斷信用卡客戶信用等級影響因素,這里沒有選擇收入,是因為收入是連續值,所以我們判斷的是除收入外最重要的影響因素

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

生成結果

在這里插入圖片描述

3. 挖掘結論分析與建議

決策樹:

在這里插入圖片描述

分析及建議:

該模型用于預測客戶的風險等級(A、B、C或D),基于幾個關鍵特征:居住類型(自購房或租房)、年齡和教育程度。

從這個決策樹中可以得出以下幾點:

  • 對于居住類型為“自購”的客戶:
    • 如果年齡小于30歲且教育程度為本科及以上,則風險等級為A的概率較高。
    • 如果年齡大于等于30歲且教育程度為本科及以上,則風險等級為B的概率較高。
    • 如果年齡大于等于30歲且教育程度為本科及以下,則風險等級為C的概率較高。
  • 對于居住類型為“租”的客戶:
    • 如果年齡小于30歲且教育程度為本科及以下,則風險等級為C的概率較高。
    • 如果年齡大于等于30歲且教育程度為本科及以下,則風險等級為D的概率較高。
    • 如果年齡大于等于30歲且教育程度為本科及以上,則風險等級為C的概率較高。

基于這些信息,給出建議如下:

  1. 針對居住類型為“自購”的年輕高學歷客戶(年齡小于30歲且教育程度為本科及以上),他們可能具有較低的風險等級(A或B)。因此,對于這類客戶,可以考慮提供更優惠的產品和服務,以吸引并保留他們。

  2. 相反地,針對居住類型為“租”且年齡較大、教育程度較低的客戶(年齡大于等于30歲且教育程度為本科及以下),他們可能具有較高的風險等級(C或D)。因此,在與這類客戶打交道時要更加謹慎,并采取相應的風險管理措施。

  3. 對于居住類型為“租”的年輕低學歷客戶(年齡小于30歲且教育程度為本科及以下),他們的風險等級也相對較高(C)。因此,需要對他們進行更多的關注和管理,以便及時發現潛在問題并采取相應措施。

依賴關系網絡

在這里插入圖片描述

在這里插入圖片描述

圖中可以看出,最強連接是居住類型,也就是客戶是否有房

說明:以上分析均不考慮連續收入,因為連續數據實在不好重新標注,可以把它當成單獨的重要因素進行挖掘

二、欺詐人口屬性分析與挖掘(同樣為不考慮收入因素)

基于消費歷史記錄表

1. 數據預處理

在這里插入圖片描述

1.1 分析關鍵影響因素

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

根據表格中的數據,我們可以得到以下結論:

  1. 日均消費金額:當日均消費金額在7到12次之間時,欺詐的可能性更高(紅色);而在5到7次之間時,欺詐的可能性較低(綠色)。
  2. 卡類別的影響:白金卡和金卡的欺詐可能性較低(綠色),而普卡的欺詐可能性較高(紅色)。
  3. 客戶號的影響:某些特定的客戶號(999993847675和999993864022)有較高的欺詐可能性(紅色)。
  4. 額度的影響:額度為100000的信用卡存在較高的欺詐可能性(紅色)。

綜上所述,銀行或其他金融機構可以根據這些信息調整其風險管理策略。例如,對于日均交易次數較多、持有普卡、擁有特定客戶號以及信用額度較大的賬戶,應加強監控和審核,以降低欺詐風險。同時,也可以通過提高安全措施、實施更嚴格的審批流程等方式來防范欺詐行為。

1.2 類別檢測

在這里插入圖片描述在這里插入圖片描述

  • 類別1的用戶主要進行小額交易,無論是單筆最小還是最大金額都很低。
  • 用戶的日均交易次數處于中等水平,表明他們是頻繁但非過度使用者。
  • 使用的卡片多為普通卡,可能意味著這些用戶尚未達到升級卡級別的資格或需求。
  • 所有記錄都沒有欺詐行為,這可能是因為這一類別的用戶交易模式較為常規,不容易被標記為欺詐。

1.3 突出顯示異常值

在這里插入圖片描述

選擇刪除異常值

2. 數據挖掘

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

決策樹

在這里插入圖片描述在這里插入圖片描述

在這里插入圖片描述

分析建議

通過這個決策樹模型,我們可以看出日均交易次數和額度對欺詐行為的影響。具體來說,當日均交易次數較高(大于等于4次且小于6次),并且額度不是固定值10000元時,欺詐的可能性會增加。因此,銀行或其他金融機構可以通過監控這類賬戶來提高風險預警能力,并采取相應的預防措施,如加強審核或設置更高的安全閾值。

此外,該模型也可以幫助我們了解欺詐行為發生的概率隨日均交易次數和額度變化的趨勢。例如,在日均交易次數較低(小于4次)或額度固定為10000元時,欺詐行為的概率較小。這有助于優化風控策略,比如設定不同的風險評估標準以適應不同的用戶行為模式。

聚類

在這里插入圖片描述在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

通過這個圖形,我們可以看到不同分類之間的差異。例如,分類1的用戶似乎是最活躍的,他們不僅有最高的日均交易次數和日均消費金額,而且單筆消費的最大金額也最高。另一方面,分類3的用戶額度最低,日均交易次數最少,且單筆消費的最大金額也最低。這可能表明分類1的用戶是高價值客戶,而分類3的用戶可能是新用戶或低活躍度用戶。

在這里插入圖片描述

在這里插入圖片描述

分析與建議

要深入分析這些數據,我們需要知道每個分類的具體含義,例如,它們可能代表不同的用戶群體,如新老用戶、活躍度高低、信用評分等級等。有了這些額外信息,我們可以構建更精確的用戶畫像,從而制定更好的市場營銷策略或風險管理政策。例如,對于分類1的用戶,銀行可能希望提供更多高端服務或優惠,而對于分類3的用戶,則可能需要關注如何提升他們的活躍度和消費額。

一共聚類9個,關于其他類別的分析在這里不再詳述。

三、excel數據挖掘總結

文章主要完成了兩項重要任務:一是分析信用卡客戶的信用等級影響因素,二是挖掘信用卡欺詐的人口屬性特征。以下是具體總結:

首先,在信用等級影響因素分析方面,文章使用Excel數據挖掘功能處理了客戶信用記錄表,通過預處理數據、構建決策樹模型和分析模型結果,得出了客戶信用等級的主要影響因素。預處理階段包括數據清理、變量轉換和異常值處理。模型分析中,居住類型、年齡和教育程度被識別為決定客戶信用等級的關鍵特征。例如,居住類型為自購房的年輕且受過高等教育的客戶(年齡小于30歲,本科及以上)具有較低的風險等級(A或B)。相反,租房的、年齡較大且教育程度較低的客戶(年齡30歲以上,本科以下)風險等級較高(C或D)。因此,文章建議銀行為自購房的年輕高學歷客戶提供更優惠的服務,同時對租房的老年低學歷客戶采取更謹慎的風險管理策略。

其次,關于信用卡欺詐的人口屬性分析,文章基于消費歷史記錄表進行了數據預處理和決策樹建模。分析結果顯示,日均消費金額、卡類別、特定客戶號和額度是欺詐行為的關鍵影響因素。日均消費金額在7到12次之間欺詐可能性更高,普卡的欺詐可能性比白金卡和金卡高,特定客戶號和大額度信用卡存在較高的欺詐風險。進一步的類別檢測發現,類別1的用戶主要進行小額交易,使用普通卡,沒有欺詐行為。決策樹模型揭示了欺詐行為與日均交易次數和額度的關系,指出日均交易次數高于4次且額度不固定為1萬元時欺詐可能性增大。銀行據此可以優化風控策略,對交易頻繁、持有普通卡、特定客戶號和大額度的賬戶加強監控。

在整個過程中,文章應用了數據預處理、異常值處理、決策樹模型構建和分析、以及聚類分析等數據分析技術。通過對數據進行深入挖掘,銀行能夠優化信用卡風險管理和欺詐防控策略,提高風險預警能力和客戶服務水平。文章強調了居住類型、年齡、教育程度、日均消費金額和額度對信用卡風險和欺詐行為的影響,為銀行提供了一套實用的分析框架和策略建議。

測發現,類別1的用戶主要進行小額交易,使用普通卡,沒有欺詐行為。決策樹模型揭示了欺詐行為與日均交易次數和額度的關系,指出日均交易次數高于4次且額度不固定為1萬元時欺詐可能性增大。銀行據此可以優化風控策略,對交易頻繁、持有普通卡、特定客戶號和大額度的賬戶加強監控。

在整個過程中,文章應用了數據預處理、異常值處理、決策樹模型構建和分析、以及聚類分析等數據分析技術。通過對數據進行深入挖掘,銀行能夠優化信用卡風險管理和欺詐防控策略,提高風險預警能力和客戶服務水平。文章強調了居住類型、年齡、教育程度、日均消費金額和額度對信用卡風險和欺詐行為的影響,為銀行提供了一套實用的分析框架和策略建議。


至此,該項目完成,使用到數據源4個表中的兩個;涉及到的數據集與挖掘報告pdf版本均已上傳資源,資源名與本文標題一致,如果覺得圖片不清晰,可以下載資源查看pdf

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/40924.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/40924.shtml
英文地址,請注明出處:http://en.pswp.cn/web/40924.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vue3+ts項目中.env配置環境變量與情景配置

一、環境變量配置 官網https://cn.vitejs.dev/guide/env-and-mode.html#intellisense 1. 新建.env開頭的文件在根目錄 為了防止意外地將一些環境變量泄漏到客戶端,只有以 VITE_ 為前綴的變量才會暴露給經過 vite 處理的代碼 .env 所有環境默認加載 .env.developm…

數字化精益生產系統--MRP 需求管理系統

MRP(Material Requirements Planning,物料需求計劃)需求管理系統是一種在制造業中廣泛應用的計劃工具,旨在通過分析和計劃企業生產和庫存需求,優化資源利用,提高生產效率。以下是對MRP需求管理系統的功能設…

Raylib 坐標系

draftx 符號調整為正數 發現采樣坐標系原點0&#xff0c;0 在左上角&#xff0c;正方向 右&#xff0c;下 繪制坐標系 原點0&#xff0c;0 在左下角&#xff0c;正方向 右&#xff0c;上 拖拽可得 #include <raylib.h> // 重整原因&#xff1a;解決新函數放大縮小之下…

當需要對多個表進行聯合更新操作時,怎樣確保數據的一致性?

文章目錄 一、問題分析二、解決方案三、示例代碼&#xff08;以 MySQL 為例&#xff09;四、加鎖機制示例五、測試和驗證六、總結 在數據庫管理中&#xff0c;經常會遇到需要對多個表進行聯合更新的情況。這種操作帶來了一定的復雜性&#xff0c;因為要確保在整個更新過程中數據…

為什么需要服務器?服務器可以做些什么

目錄 一、服務器和電腦的區別二、什么是SSH三、什么是免密碼登錄四、服務器如何實現SSH免密碼登錄 一、服務器和電腦的區別 服務器和電腦是兩種不同類型的計算機系統&#xff0c;它們在設計、功能和用途上存在明顯的區別。首先&#xff0c;從硬件配置上看&#xff0c;服務器通…

vb.netcad二開自學筆記3:啟動與銷毀

Imports Autodesk.AutoCAD.ApplicationServicesImports Autodesk.AutoCAD.EditorInputImports Autodesk.AutoCAD.RuntimePublic Class WellcomCADImplements IExtensionApplicationPublic Sub Initialize() Implements IExtensionApplication.InitializeMsgBox("net程序已…

JDK都出到20多了,你還不會使用JDK8的Stream流寫代碼嗎?

目錄 前言 Stream流 是什么&#xff1f; 為什么要用Steam流 常見stream流使用案例 映射 map() & 集合 collect() 單字段映射 多字段映射 映射為其他的對象 映射為 Map 去重 distinct() 過濾 filter() Stream流的其他方法 使用Stream流的弊端 前言 當你某天看…

基于深度學習LightWeight的人體姿態檢測跌倒系統源碼

一. LightWeight概述 light weight openpose是openpose的簡化版本&#xff0c;使用了openpose的大體流程。 Light weight openpose和openpose的區別是&#xff1a; a 前者使用的是Mobilenet V1&#xff08;到conv5_5&#xff09;&#xff0c;后者使用的是Vgg19&#xff08;前10…

公務員考試、事業編考試、教師資格證、面試、K12資料、電子書

點擊上方△騰陽 關注 作者 l 騰陽 轉載請聯系授權 你好&#xff0c;我是騰陽。 在這個自媒體的海洋里&#xff0c;我曾是一只迷失方向的小鳥&#xff0c;多次嘗試飛翔卻總是跌跌撞撞。 但每一次跌倒&#xff0c;都讓我更堅定地相信&#xff0c;只要不放棄&#xff0c;總…

【Unity2D 2022:Particle System】添加命中粒子特效

一、創建粒子特效游戲物體 二、修改粒子系統屬性 1. 基礎屬性 &#xff08;1&#xff09;修改發射粒子持續時間&#xff08;Duration&#xff09;為1s &#xff08;2&#xff09;取消勾選循環&#xff08;Looping&#xff09; &#xff08;2&#xff09;修改粒子存在時間&…

2024全網最全面及最新且最為詳細的網絡安全技巧五 之 SSRF 漏洞EXP技巧,典例分析以及 如何修復 (上冊)———— 作者:LJS

五——SSRF漏洞 EXP技巧&#xff0c;典例分析以及 如何修復 目錄 五——SSRF EXP技巧&#xff0c;典例分析以及 如何修復 5.1Apache mod_proxy SSRF&#xff08;CVE-2021-40438&#xff09;的一點分析和延伸 0x01 Apache Module綜述 0x02 漏洞原理分析 Apache在配置反代的后端…

Vue的學習之生命周期

一、生命周期 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>Vue的學習</title><script src"vue.js" type"text/javascript" charset"utf-8"></script></head>&l…

C#如何從中級進階到高級開發

從中級C#開發進階到高級開發&#xff0c;需要深入理解和掌握更復雜的技術和架構&#xff0c;同時培養解決問題的能力和創新思維。以下是一些關鍵的技能和步驟&#xff0c;可以幫助你從中級向高級開發邁進&#xff1a; 1. 深入理解C#語言特性 泛型&#xff1a;熟練使用泛型提高…

Java實現登錄驗證 -- JWT令牌實現

目錄 1.實現登錄驗證的引出原因 2.JWT令牌2.1 使用JWT令牌時2.2 令牌的組成 3. JWT令牌&#xff08;token&#xff09;生成和校驗3.1 引入JWT令牌的依賴3.2 使用Jar包中提供的API來實現JWT令牌的生成和校驗3.3 使用JWT令牌驗證登錄3.4 令牌的優缺點 1.實現登錄驗證的引出 傳統…

強化Linux系統安全性:從基礎命令到高級管理

強化Linux系統安全性&#xff1a;從基礎命令到高級管理 引言 在網絡安全領域&#xff0c;Linux系統因其穩定性和安全性而廣受歡迎。作為一名網絡安全專家&#xff0c;我將分享如何通過Linux基礎命令和高級管理技巧來加強系統的安全性。本文將基于《學神 IT 教育》提供的Linux…

Debezium報錯處理系列之第110篇: ERROR Error during binlog processing.Access denied

Debezium報錯處理系列之第110篇:ERROR Error during binlog processing. Last offset stored = null, binlog reader near position = /4 Access denied; you need at least one of the REPLICATION SLAVE privilege for this operation 一、完整報錯二、錯誤原因三、解決方法…

python 切入點(EntryPoints)使用

文章目錄 EntryPoints 介紹EntryPoints案例EntryPoints 介紹 官網參考 EntryPoints 是發布的python 項目的一種機制,可以提供對自身項目的切入點,供其他項目代碼使用。在python環境中可以通過importlib.metadata.entry_points 函數發現所有的切入點插件,并在代碼中加載、調…

08_排序

基本概念與分類 假設含有n個記錄的序列為 { r 1 , r 2 , . . . , r n } \{r_1,r_2,...,r_n\} {r1?,r2?,...,rn?}&#xff0c;其相應的關鍵字分別為 { k 1 , k 2 , . . . , k n } \{k_1,k_2,...,k_n\} {k1?,k2?,...,kn?}&#xff0c;需確定1&#xff0c;2&#xff0c;…&…

微服務: Nacos部署安裝與properties配置

Nacos 是阿里巴巴開源的一款用于動態服務發現、配置管理和服務管理的基礎設施。Nacos 這個名稱源自于 “Dynamic Naming and Configuration Service”。它主要是用于解決微服務架構中服務發現和配置管理的問題。 Nacos 單機模式的部署安裝 1. 安裝(Windows環境) Nacos是Java…

Java線程基礎知識總結

基礎概念 Java 線程是并發編程的基礎&#xff0c;涉及到線程的創建、管理、同步以及通信。理解和掌握線程的使用對于編寫高效和響應快速的應用程序至關重要。 1. 線程基礎 線程是程序中的執行流。每個Java程序至少有一個線程 — 主線程&#xff08;main&#xff09;。通過使…