多元數據直觀表示(R語言)

一、實驗目的:

? ? ? ?通過上機試驗,掌握R語言實施數據預處理及簡單統計分析中的一些基本運算技巧與分析方法,進一步加深對R語言簡單統計分析與圖形展示的理解。

數據:
鏈接: https://pan.baidu.com/s/1kMdUWXuGCfZC06lklO5iXA 提取碼: g55h

二、實驗內容:

bank.csv文件中數據來自1969-1971年美國一家銀行的474名職員情況調查。該數據共8個變量,包括:

gender:性別,1代表男性,2代表女性;

educ:受教育年限(單位:年);

jobcat:職位等級,分1,2,3級,1級工作地位最低,3級最高;

salary:當前工資(單位:美元/年);

salbegin:初始工資,指進入銀行初始薪酬(單位:美元/年);

jobtime:工作月份,指在銀行累計工作時間(單位:月);??

prevexp:以前工作經歷,指在其他單位累計工作時間(單位:月);

minority: 是否少數民族,0代表不是,1代表是。

(1)請繪制折線圖,展示工資如何隨工作時間變化,并對圖形進行解讀。

(2)請繪制氣泡圖,展示性別、職位等級與當前工資的關系,并對圖形進行解讀。

3)(至少有兩個分析)自行選擇感興趣的變量與分析目的,利用基本統計分析圖形進行直觀表示并加以解讀。此小題對使用何種圖形展示不做嚴格要求,只需不是折線圖及氣泡圖即可。

三、實驗過程與結果:

1)繪制折線圖,展示工資如何隨工作時間變化,并對圖形進行解讀:

data<-read.csv("E:/學習資料及作業/2.2多元統計分析R/實驗1/bank.csv")datad1<-aggregate(salary~jobtime,data,mean)? #求salary的均值library(ggplot2)ggplot(data=d1,aes(x=jobtime,y=salary))+ # 折線圖geom_line(color="green",size=1) #線的顏色、粗細

運行結果:

解讀分析:

? ? ? ?從總體上看,工作時間jobtime與工資salary之間不存在線性關系,即使工作時間在小范圍內變化,薪資可能波動較大。當工作時間超過90時,總體的薪資會比工作時間小于90的多一點兒,表明工作時間會對薪資有一定的影響,但薪資并不是只由工作時間直接決定的,還存在其他因素對其有影響。

2)繪制氣泡圖,展示性別、職位等級與當前工資的關系,并對圖形進行解讀。

d2<-aggregate(x=data$salary,by=list(data$jobcat,data$gender),FUN=mean)d2ggplot(data=d2,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #調整圓圈透明度scale_size(range = c(1, 10), name="性別、職位等級與當前工資的關系圖")+ #圖例名稱xlab('jobcat') +? # 更改x、y軸名稱ylab('gender')

運行結果:

解讀分析:

? ? ? ?男性13等級都有分布,女性只有13等級,從男性角度來看,12等級的薪資差別不大,但123等級薪資相差較大,都快相差兩倍了;從女性角度來看,等級1與等級3相差巨大。并且男性和女性都為等級1時,男性的薪資與女性的相差較大。

3)自行選擇感興趣的變量與分析目的,利用基本統計分析圖形進行直觀表示并加以解讀。此小題對使用何種圖形展示不做嚴格要求,只需不是折線圖及氣泡圖即可。

分別用箱型圖繪制職位等級與受教育年限、職位等級與薪資的關系:

代碼:

data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=educ))+geom_boxplot()+labs(title="職位等級與受教育年限的關系",x="職位等級",y="受教育年限")+theme(plot.title = element_text(hjust=0.5))data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=salary))+geom_boxplot()+labs(title="職位等級與薪資的關系",x="職位等級",y="薪資")+theme(plot.title = element_text(hjust=0.5))

運行結果:

?

解讀分析:

? ? ? ?從均值來看,等級1、2的受教育的年限均值相同,等級3最高,但等級1、2的薪資均值相差不大,等級3的薪資卻比等級1、2高得多,從某種程度上可以表明受教育年限越高,其薪資也越高。等級2的薪資較為集中,幾乎沒什么波動。

受教育年限、以前工作經歷與初始工資的關系:

代碼:

d3<-aggregate(x=data$salbegin,by=list(data$prevexp,data$educ),FUN=mean)ggplot(data=d3,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #調整圓圈透明度scale_size(range = c(1, 10), name="受教育年限、以前工作經歷與初始工資的關系圖")+ #圖例名稱xlab('prevexp') +? # 更改x、y軸名稱ylab('educ')

解讀分析:

受教育越高的平均工作時間要比受教育低的少,并且獲得的薪酬也相對多一些。

以前的工作經歷對初始薪資的影響:

代碼:

d4<-aggregate(salbegin~prevexp,data,mean)order<-sort(d4$prevexp,decreasing=T)ggplot(data=d4,aes(prevexp,salbegin))+geom_bar(stat="identity",width=0.8,colour="black",linewidth=0.25,fill="#FC4E07",alpha=1)

運行結果:

解讀分析:

? ? ? ? 以前的工作經歷大多集中在0-120個月,即1-10年,隨著工作經歷的增加,會出現少數再找工作時,其初始工資很高,但是總體工作經歷對其再工作時的初始工資沒有什么影響。并且當工作經歷達到200個月以上時,再次換工作的人也偏少了,這可能與他們進入中年,追求平穩的生活可能有關。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/72289.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/72289.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/72289.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

第8天:面向對象編程入門 - 類與對象

第8天&#xff1a;面向對象編程入門 - 類與對象 一、&#x1f4da; 今日學習目標 &#x1f3af; 掌握類與對象的定義與使用&#x1f527; 理解封裝、繼承、多態三大特性&#x1f4a1; 完成銀行賬戶管理系統實戰&#x1f6e0;? 學會構造函數與析構函數的編寫 二、?? 核心知…

Hadoop之02:MapReduce編程模型

MapReduce編程模型 理解MapReduce編程模型獨立完成一個MapReduce程序并運行成功了解MapReduce工程流程掌握并描述出shuffle全過程&#xff08;面試&#xff09;獨立編寫課堂及作業中的MR程序理解并解決數據傾斜 1. MapReduce編程模型 Hadoop架構圖 Hadoop由HDFS分布式存儲、M…

2.7 大模型RAG內容安全合規檢查-大模型ACP模擬題-真題

單選題 在RAG應用中&#xff0c;輸入內容合規檢查的正確順序是&#xff1f; A. 先處理模型生成&#xff0c;后檢查用戶輸入 B. 先檢查用戶輸入&#xff0c;后處理模型生成 ? C. 僅檢查用戶輸入 D. 僅檢查模型輸出 解析&#xff1a;合規流程應優先過濾用戶輸入風險&#xff0…

mapbox基礎,使用geojson加載heatmap熱力圖層

????? 主頁: gis分享者 ????? 感謝各位大佬 點贊?? 收藏? 留言?? 加關注?! ????? 收錄于專欄:mapbox 從入門到精通 文章目錄 一、??前言1.1 ??mapboxgl.Map 地圖對象1.2 ??mapboxgl.Map style屬性1.3 ??heatmap熱力圖層樣式二、??使用geojs…

Deepseek Api Function Calling解析(tools、tool_calls)Deepseek函數調用流程圖、Python代碼示例

文章目錄 Function Calling介紹**核心原理**1. **動態擴展模型能力**2. **JSON結構化交互** **實現步驟**&#xff08;以支持Function Calling的模型為例&#xff09;1. **定義可用函數**2. **模型匹配與生成**3. **開發者執行函數**4. **結果反饋給模型** **DeepSeek R1的當前…

在2023idea中如何創建SpringBoot

目錄 一.下載和安裝 Maven 1.前往 https://maven.apache.org/download.cgi 下載最新版的 Maven 程序 2.將文件解壓到D:Program FilesApachemaven目錄 3.新建環境變量MAVEN_HOME&#xff0c;賦值D:Program FilesApachemaven 4.編輯環境變量Path&#xff0c;追加%MAVEN_HOME…

基于YOLO11深度學習的遙感視角農田檢測與分割系統【python源碼+Pyqt5界面+數據集+訓練代碼】深度學習實戰、目標分割、人工智能

《------往期經典推薦------》 一、AI應用軟件開發實戰專欄【鏈接】 項目名稱項目名稱1.【人臉識別與管理系統開發】2.【車牌識別與自動收費管理系統開發】3.【手勢識別系統開發】4.【人臉面部活體檢測系統開發】5.【圖片風格快速遷移軟件開發】6.【人臉表表情識別系統】7.【…

用冒泡排序法模擬qsort函數

目錄 1.前言 2.qsort函數的介紹 ?3.冒泡法回顧 4.模擬qsort---buble_sort 4.1 buble_sort格式 4.2 主函數&#xff0c;以int類型為例 4.3comp_int函數的功能設計 4.4 swap函數的功能設計 5. 總代碼概覽 1.前言 今天&#xff0c;小鄧兒帶大家用冒泡排序法來模擬一下qs…

全星研發項目管理APQP軟件系統:鑄造芯片集成電路產業研發體系化建設平臺

全星研發項目管理APQP軟件系統&#xff1a;鑄造芯片集成電路產業研發體系化建設平臺 在芯片集成電路行業&#xff0c;研發效率和質量直接決定了企業的核心競爭力。面對日益復雜的芯片設計、日益縮短的產品生命周期以及日益嚴格的質量要求&#xff0c;傳統的研發管理模式已難以滿…

《Python實戰進階》No 11:微服務架構設計與 Python 實現

第11集&#xff1a;微服務架構設計與 Python 實現 2025年3月3日更新了代碼和微服務運行后的系統返回信息截圖&#xff0c;所有代碼在 python3.11.5虛擬環境下運行通過。 微服務架構通過將復雜應用拆分為獨立部署的小型服務&#xff0c;顯著提升了系統的可擴展性和維護性。本集…

USRP7440-通用軟件無線電平臺

1、產品描述 USRP7440基于第三代XILINX Zynq UltraScale RFSoC架構&#xff0c;它將射頻ADC、DAC、ARM、FPGA等集成一體&#xff0c;瞬時帶寬可以達到2.5GHz&#xff0c;尤其適合于射頻直采應用&#xff0c;比如通信與雷達。 第一代RFSOC高達4GHz ? 8x 或 16x 6.554GSPS DAC…

1.2.3 使用Spring Initializr方式構建Spring Boot項目

本實戰概述介紹了如何使用Spring Initializr創建Spring Boot項目&#xff0c;并進行基本配置。首先&#xff0c;通過Spring Initializr生成項目骨架&#xff0c;然后創建控制器HelloController&#xff0c;定義處理GET請求的方法hello&#xff0c;返回HTML字符串。接著&#xf…

【小羊肖恩】小羊杯 Round 2 C+K

題目鏈接&#xff1a;https://ac.nowcoder.com/acm/contest/100672#question C.是毛毛蟲嗎&#xff1f; 思路&#xff1a; 其實很簡單&#xff0c;假設我們要滿足題目所給條件&#xff0c;那么這個毛毛蟲最壞情況下肯定是一條如下圖所示的無向圖 右端省略號為對稱圖形 &…

不謂俠--記錄

音樂《不謂俠》 衣襟上 別好了晚霞 余暉送我牽匹老馬 正路過 煙村里人家 恰似當年故里正飛花 醉過風 喝過茶 尋常巷口尋個酒家 在座皆算老友 碗底便是天涯 天涯遠 無處不為家 蓬門自我也像廣廈 論意氣 不計多或寡 占三分便敢自稱為俠 刀可捉 拳也耍 偶爾閑來…

不同規模企業如何精準選擇AI工具: DeepSeek、Grok 和 ChatGPT 三款主流 AI 工具深度剖析與對比

本文深入探討了最近國內外主流的 DeepSeek、Grok 和 ChatGPT 三款主流 AI 工具的技術細節、性能表現、應用場景及局限性&#xff0c;并從技術能力、功能需求、成本預算、數據安全和合規以及服務與支持五個關鍵維度&#xff0c;詳細分析了不同規模企業在選擇 AI 工具時的考量因素…

Vue核心知識:KeepLive全方位分析

KeepAlive 是 Vue 組件中的一個重要功能&#xff0c;主要用于緩存組件&#xff0c;以提升性能和用戶體驗。 目錄 一、KeepAlive 基本概念二、KeepAlive 的核心原理三、KeepAlive 關鍵屬性解析1. include&#xff1a;指定需要緩存的組件2. exclude&#xff1a;指定不需要緩存的組…

【電力——tarjan割點,求連通塊】

題目 分析 這是割點的板子 代碼 #include <bits/stdc.h> using namespace std;const int N 1e410; const int M 3e410;int h[N], e[M], ne[M], idx; int dfn[N], low[N], tot; int root, ans;void add(int a, int b) // 添加一條邊a->b {e[idx] b, ne[idx] h…

【HTTP】解碼網絡通信的奧秘:HTTP,IP 地址,端口,DNS及NAT地址轉換的協同之舞

引言 每文學習一句詩&#xff1a;行一棋不足以見智&#xff0c;彈一弦不足以見悲 ——《淮南子說林訓》 譯文&#xff1a;走一個棋子&#xff0c;不足以現出智慧&#xff1b;彈一根琴弦&#xff0c;不能夠使人產生悲哀之情。 自述&#xff1a;互聯網現如今已經成為每個人都離不…

18、深拷貝與淺拷貝的區別【中高頻】

淺拷貝 淺拷貝只是拷貝了一個指針&#xff0c;并沒有開辟一塊新的內存。拷貝的指針和原來的指針 指向同一塊地址。當一個對象修改了資源&#xff0c;另一個對象也會受到影響&#xff0c;因此淺拷貝是有風險的&#xff1a;當兩個對象都銷毀 并調用析構函數時&#xff0c;會造成…

【Linux】從入門到精通:Make與Makefile完全指南

歡迎來到 CILMY23 的博客 &#x1f3c6;本篇主題為&#xff1a;從入門到精通&#xff1a;Make與Makefile完全指南 &#x1f3c6;個人主頁&#xff1a;CILMY23-CSDN博客 &#x1f3c6;系列專欄&#xff1a;C | C語言 | Linux | Python | 數據結構和算法 | 算法專題 &#x1…