計算機競賽 python+大數據校園卡數據分析

0 前言

🔥 優質競賽項目系列,今天要分享的是

🚩 基于yolov5的深度學習車牌識別系統實現

🥇學長這里給一個題目綜合評分(每項滿分5分)

  • 難度系數:4分
  • 工作量:4分
  • 創新點:3分

該項目較為新穎,適合作為競賽課題方向,學長非常推薦!

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate


1 課題介紹

近年來,大數據的受關注程度越來越高。如何對大數據流進行抽取轉換成有用的信息并應用于各行各業變得越來越重要。如今,校園一卡通系統在高校應用十分廣泛,大部分高校主要利用校園一卡通對校園中的各類消費閱、補助領取等進行統一管理。通過數據分析算法,對大學生校內消費記錄進行整理、分類、預測,從而整體反應學生在校消費情況,形成量化的評判標準,同時也為今后的貧困生資助管理工作提供可靠的數據支持,輔助完成貧困生的相關工作。

2 數據預處理

在進行數據挖掘或者數據分析之前,需要對“臟數據” 數據進行數據預處理,一般采用數據清理、數據集成、數據變換等方式,已獲得更好的分析效果。

2.1 數據清洗

由于數據庫中有著大量的數據表,我們獲取到的數據表中會存在著異常數據,如數據不合法與常識不符,同一個字段屬性值來源于多張數據表且數值不一樣等。數據預處理主要去處可忽略的字段、忽略空缺記錄、可處理噪聲的數據、可刪除的數據等。由于部分校園卡用戶,如教職工、研究生等,消費時具有很強的隨機性和離散型。同時,為了保護隱私,對姓名、學號等屬性要做脫敏和隱私處理。

2.2 數據規約

預處理后的數據不一定適合直接使用,因此需要對數據進行集成和變換,將多個數據庫中提取出的數據項整合到一起,組成新的數據集環境,并經過詳細對比和篩選解決數據不一致和數據冗余等問題。為了適合分析,我們要對數據進行離散化和概念分層處理。

3 模型建立和分析

通過建立消費數據分析模型,對學校校園卡消費行為進行分析,總結學校學生

? #1.總體消費情況
? #2.不同專業、性別的學生與消費能力的關系
? #3.不同性別的學生與消費項目的關系
? #4.消費時間的特征分析
? #5.消費地點與門禁通過地點的關系分析
? #6.學生消費特征分層模型

    import matplotlib.pyplot as pltexpen_rec = pd.read_csv(r'C:\Users\River\Desktop\校園卡數據\expen_rec.csv',encoding='gbk')student = pd.read_csv(r'C:\Users\River\Desktop\校園卡數據\student.csv',encoding='gbk')access = pd.read_csv(r'C:\Users\River\Desktop\校園卡數據\access.csv',encoding='gbk')all_data1 = pd.merge(expen_rec,student,on ='校園卡號',how='left')all_data1.head()

在這里插入圖片描述

3.1 不同專業、性別的學生與消費能力的關系

    from pylab import *plt.rcParams['font.sans-serif']=['SimHei']%matplotlib inlinetotal = con_sum.groupby(['性別'])[['消費金額']].sum()total1= con_sum.groupby(['性別'])[['消費金額']].count()plt.subplot(121)plt.pie(total['消費金額'],labels=total.index,autopct='%2.f%%')plt.title('男女生消費總金額對比')plt.subplot(122)plt.pie(total1['消費金額'],labels=total1.index,autopct='%2.f%%')plt.title('男女生人數對比')plt.show()

在這里插入圖片描述

?

    fig1 = plt.figure(num =1, figsize=(8,4))plt.title('各消費等級人數')plt.xlabel('消費等級')x1 =['(0, 100] ','(100, 150]','(150, 200] ','(200, 250]','(250, 300]','(300, 350]','(350, 400]','(400, 500]','(500, 3000]']y1 = list(table1.values)y2 =list(table2.loc[('女',slice(None))].values)y3 =list(table2.loc[('男',slice(None))].values)plt.plot(x1,y1,label='總體')plt.plot(x1,y2,label='女生')plt.plot(x1,y3,label='男生')plt.legend(loc=2)plt.show()

在這里插入圖片描述

?

    #分析各專業總消費金額排列fig2 = plt.figure(num =2, figsize=(14,6))plt.title('各專業總消費金額排列')plt.xlabel('專業名稱')x1=table3.indexy1=table3['消費總金額']plt.bar(x1,y1)plt.xticks(x1,x1,rotation=45)for a,b in zip(x1,y1):plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=9)plt.show()

在這里插入圖片描述

小結:

1.該校18級學生的人均每月校園卡消費295.96元;

2.女生人數占比59%,總消費額占比56%,消費總金額與性別差異不大;

3.從消費金額級區間上看,學生的總體消費金額主要在[200,500]的區間內,但男女生消費存在明顯差異:女生消費金額在[200-350]區間內人數明顯高于男生,但隨著增加而下降,而男生在400以上的區間內的人數高于女生。男生對校園卡消費方式差異較大,一般不使用或者經常使用。女生多數選擇輕度使用。

4.從各專業消費總金額上看機械制造專業最高,機械制造(學徒)專業最低。但結合各專業的人均消費分析,各專業的人均消費差異很小,標準差僅為42.8。人均消費最高的機械制造(學徒)專業因為人數最少僅為14人,對總體數據影響較小。可以得出:學生的校園卡消費能力與專業無明顯區別。

3.2 消費時間的特征分析

    fig7 = plt.figure(num =7, figsize=(8,4))mon1= time_tab.groupby(['日期'])[['消費金額']].count()mon2= time_tab1.groupby(['日期'])[['消費金額']].count()mon3= time_tab2.groupby(['日期'])[['消費金額']].count()plt.title('月度消費次數趨勢分析')plt.xlabel('日期')x1 = list(mon1.index)y1 = list(mon1.values)y2 =list(mon2.values)y3 =list(mon3.values)plt.plot(x1,y1,label='總體')plt.plot(x1,y2,label='女生')plt.plot(x1,y3,label='男生')plt.legend(loc=2)plt.show()#除個別天數外,女生均高于男生,每周之間趨勢相似

在這里插入圖片描述

?

    fig8 = plt.figure(num =8, figsize=(8,4))wk1= time_tab.groupby(['星期'])[['消費金額']].count()wk2= time_tab1.groupby(['星期'])[['消費金額']].count()wk3= time_tab2.groupby(['星期'])[['消費金額']].count()def autolabel(rects):for rect in rects:height = rect.get_height()plt.text(rect.get_x()+rect.get_width()/2.-0.2, 1.03*height, '%s' % float(height))plt.title('月度消費次數趨勢分析')plt.xlabel('星期')y1 = wk2['消費金額']y2 = wk3['消費金額']x1=range(len(y1))x2=[i +0.35 for i in x1]a=plt.bar(x1,y1, width=0.3,label='女生',color='blue')b=plt.bar(x2,y2, width=0.3,label='男生',color='green')autolabel(a)autolabel(b)plt.legend()plt.xticks(x1,list(wk1.index),rotation=45)plt.show()#周一至周三消費次數較高,男女生在一周內的消費頻率的波動沒有明顯差異

在這里插入圖片描述

1.從一個月的每天的消費次數上看,除個別天數男女生消費次數相近,多大多數天數的女生的消費次數高于男生,且每周之間趨勢相似,可以得出學生日常的消費習慣比較穩定;

2.從每周的消費次數匯總上看,周一至周三消費次數較高,并且逐步下降,周末為消費次數最低的時候。男女生在一周內的消費頻率的波動趨勢相同,沒有明顯差異;

3.從每天的消費的時間段分析上看,周末的刷卡消費次數為平常的12%。食堂可以根據數據情況,適當安排休息,減少人力成本浪費;

4.平常時間的早、中、晚餐的用餐時間集中在7點、11點、17-18點時間段。周末消費的時間相對平緩,早餐的高峰時間會延后到8點時間段,且持續有人員消費,中餐的用餐時間也會有部分后延到12點的時間段。晚餐時間則會部分提前17點的時間段進行,需要提前做好食堂的準備事項。

4 Web系統效果展示

以上是校園卡分析的部分過程,我們還可以做成web系統來展示。效果如下:

4.平常時間的早、中、晚餐的用餐時間集中在7點、11點、17-18點時間段。周末消費的時間相對平緩,早餐的高峰時間會延后到8點時間段,且持續有人員消費,中餐的用餐時間也會有部分后延到12點的時間段。晚餐時間則會部分提前17點的時間段進行,需要提前做好食堂的準備事項。

Web系統效果展示

以上是校園卡分析的部分過程,我們還可以做成web系統來展示。效果如下:

在這里插入圖片描述

在這里插入圖片描述

5 最后

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/41723.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/41723.shtml
英文地址,請注明出處:http://en.pswp.cn/news/41723.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

記錄一個編譯TubeTK時的報錯:at_check問題

在使用如下命令安裝TubeTK的cuda_nms時,報了一個錯誤,記錄一下這個錯誤和解決辦法 (base) redmeryredmery:~/Desktop/MOT/TubeTK/post_processing/nms$ python setup.py build_ext --inplace因為這個命令是在/home/redmery/Desktop/MOT/TubeTK/install/…

Talk | ACL‘23 杰出論文獎上海交通大學吳蔚琪:預訓練語言模型對本體知識的記憶與理解

本期為TechBeat人工智能社區第523期線上Talk! 北京時間8月17日(周四)20:00,上海交通大學碩士研究生—吳蔚琪的Talk已準時在TechBeat人工智能社區開播! 她與大家分享的主題是: “預訓練語言模型對本體知識的記憶與理解”,分享了預訓…

Python入門【TCP建立連接的三次握手、 TCP斷開連接的四次揮手、套接字編程實戰、 TCP編程的實現、TCP雙向持續通信】(二十七)

👏作者簡介:大家好,我是愛敲代碼的小王,CSDN博客博主,Python小白 📕系列專欄:python入門到實戰、Python爬蟲開發、Python辦公自動化、Python數據分析、Python前后端開發 📧如果文章知識點有錯誤…

【c語言】通訊錄(動態版+文件+背景音樂)含源碼

開飯了,之前寫的通訊錄,是否會有人覺得申請1000人的空間是不是有點用不上呀,怎么才能做到要多少申請多少個呢??我們學完動態內存管理,和文件的相關操作,終于可以繼續完善我們的通訊錄了 船新版本…

機器學習基礎(三)

邏輯回歸 場景 垃圾郵件分類 預測腫瘤是良性還是惡性 預測某人的信用是否良好 正確率與召回率 正確率與召回率(Precision & Recall)是廣泛應用于信息檢索和統計學分類領域的兩個度量值,用來評價結果的質量。 一般來說,正確率就是檢索出來的條目有多少是正確的,召回率就…

salesforce創建定時任務時明明implements the Schedulable interface卻提示不是的解決方法

Apex類: global class TimesheetWeeklyJob implements Schedulable{global void execute( SchedulableContext SC ) {WeeklyTimesheetProcess.markSubmitted();WeeklyTimesheetProcess.createNewSheets();} }卻提示: Error: You must select an Apex cl…

數據結構:二叉樹的遞歸實現(C實現)

個人主頁 : 個人主頁 個人專欄 : 《數據結構》 《C語言》 文章目錄 前言一、樹的概念二、二叉樹二叉樹的概念二叉樹的性質 三、二叉樹鏈式結構實現二叉樹節點定義創建二叉樹節點遍歷二叉樹先序遍歷二叉樹(BinaryTreePrevOrder)中序遍歷二叉樹(BinaryTree…

Air780EG —— 合宙4G定位解決方案

定位模式: 外部單片機控制模式(常見于AT固件客戶): 開機 -> 搜星 -> 定位成功 -> 上報 -> 關機 780E自行控制模式(常見于二次開發客戶,AT用戶也可以使用): 開機 -> 搜星 -> 定位成功 -> 模塊休眠,關閉GP…

億發創新中醫藥信息化解決方案,自動化煎煮+調劑,打造智能中藥房

傳統中醫藥行業逐步復興,同時互聯網科技和人工智能等信息科技助力中醫藥行業逐步實現數字化轉型。利用互聯網、物聯網、大數據等科技,實現現代科學與傳統中醫藥的結合,提供智能配方顆粒調配系統、中藥自動化調劑系統、中藥煎配智能管理系統、…

【從零學習python 】40.python魔法方法(一)

文章目錄 魔法方法1. __init__ 方法2. __del__ 方法3. __str__ 方法4. __repr__ 方法5. __call__ 方法進階案例 魔法方法 Python 里有一種方法,叫做魔法方法。Python 的類里提供的,兩個下劃線開始,兩個下劃線結束的方法,就是魔法…

如何切換goland之中的版本號(升級go 到1.20)

go 安裝/版本切換_go 切換版本_云滿筆記的博客-CSDN博客 用brew就行: echo export PATH"/opt/homebrew/opt/go1.20/bin:$PATH" >> ~/.zshrc

[國產MCU]-BL602開發實例-OLED-SSD1306驅動與U8g2移植

OLED-SSD1306驅動與U8g2移植 文章目錄 OLED-SSD1306驅動與U8g2移植1、OLED介紹2、SSD1306介紹2、U8g2介紹3、U8g2移植3.1 定義U8g2圖形庫的移植函數3.2 移植函數實現3.3 移植函數調用4、驅動測試本文將詳細介紹如何在BL602中移植U8g2圖形庫,并通過U8g2庫驅動OLED SSD1306顯示屏…

Linux6.40 Kubernetes 配置資源管理

文章目錄 計算機系統5G云計算第三章 LINUX Kubernetes 配置資源管理一、Secret1.Secret 四種類型1)kubernetes.io/service-account-token2)Opaque3)kubernetes.io/dockerconfigjson4)kubernetes.io/tls 2.Pod 需要先引用才能使用某…

React入門 jsx學習筆記

一、JSX介紹 概念:JSX是 JavaScript XML(HTML)的縮寫,表示在 JS 代碼中書寫 HTML 結構 作用:在React中創建HTML結構(頁面UI結構) 優勢: 采用類似于HTML的語法,降低學…

因果推斷(四)斷點回歸(RD)

因果推斷(四)斷點回歸(RD) 在傳統的因果推斷方法中,有一種方法可以控制觀察到的混雜因素和未觀察到的混雜因素,這就是斷點回歸,因為它只需要觀察干預兩側的數據,是否存在明顯的斷點…

【C++入門到精通】C++入門 —— list (STL)

閱讀導航 前言一、list簡介1.概念2.特點 二、list的使用1.list的構造2.常見的操作?std::list類型的增、刪、查、改 三、list與vector的對比溫馨提示 前言 文章綁定了VS平臺下std::list的源碼,大家可以下載了解一下😍 前面我們講了C語言的基礎知識&…

C語言實例_獲取文件MD5值

一、MD5介紹 MD5(Message Digest Algorithm 5)是一種常用的哈希函數算法。將任意長度的數據作為輸入,并生成一個唯一的、固定長度(通常是128位)的哈希值,稱為MD5值。MD5算法以其高度可靠性和廣泛應用而聞名…

全球磁強計市場價值約為16.2億美元,預測期內將以超過5.21%的增長率增長

磁強計是一種用于測量磁場強度和方向的儀器。它可以檢測和測量地球磁場、物體的磁性、地下礦藏、磁性材料等。磁強計在地球科學、物理學、地質學、勘探、礦業等領域具有廣泛的應用。 根據阿譜爾(APO)的統計及預測,2022年全球磁強計市場價值約…

跳跳!(c++題解)

題目描述 你是一只小跳蛙,你特別擅長在各種地方跳來跳去。 這一天,你和朋友小 F 一起出去玩耍的時候,遇到了一堆高矮不同的石頭,其中第 ii 塊的石頭高度為 hi?,地面的高度是 h0?0。你估計著,從第 ii 塊…

ts與vue

ts與Vue 如果你已經學習了typeScript,但不知道如何在vue項目中使用,那么這篇文章將會很適合你。參考千峰教育 kerwin視頻 1.會自動推導,隱士推導。提示 類型系統。 獨立模塊。 isolatedModules選項:是否配置為獨立的模塊。 減少報錯 let …