【應用多元統計分析】--多元數據的直觀表示(R語言作圖)

例1.2 為了研究全國31個省、市、自治區2018年城鎮居民生活消費的分布規律,根據調查資料做區域消費類型劃分。

指標:

食品x1:人均食品支出(元/人) ?

衣著x2:人均衣著商品支出(元/人)

居住x3:人均居住支出(元/人)

生活x4:人均家庭設備用品及服務支出(元/人)

交通x5:人均交通和通訊支出(元/人)

教育x6:人均娛樂教育文化服務支出(元/人)

醫療x7:人均醫療保健支出(元/人) ?

其他x8:人均雜項商品和服務支出(元/人)

地區

x1

x2

x3

x4

x5

x6

x7

x8

北京

8064.9

2175.5

14110.3

2371.9

4767.4

3999.4

3274.5

1078.6

天津

8647.5

1990.0

6406.3

1818.4

4280.9

3186.6

2676.9

896.3

河北

4271.3

1257.4

4050.4

1138.7

2355.4

1734.5

1540.5

373.8

山西

3688.2

1261.0

3228.5

855.6

1845.2

1940.0

1635.1

356.4

內蒙古

5324.3

1751.2

3680.0

1204.6

3074.3

2245.4

1847.5

537.9

遼寧

5727.8

1628.1

4169.5

1259.4

2968.2

2708.0

2257.1

680.2

吉林

4417.4

1397.0

3294.8

899.4

2479.7

2193.4

2012.0

506.7

黑龍江

4573.2

1405.4

3176.3

866.4

2196.6

2030.3

2235.3

490.4

上海

10728.2

2036.8

14208.5

2095.5

4881.2

5049.4

3070.2

1281.5

江蘇

6529.8

1541.0

6731.2

1493.3

3522.8

2582.6

2016.4

590.4

浙江

8198.3

1813.5

7721.2

1652.4

4302.0

3031.3

2059.4

692.6

安徽

5414.7

1137.4

3941.9

1041.2

2082.1

1810.4

1224.0

392.8

福建

7572.9

1212.1

6130.0

1223.1

2923.3

2194.0

1234.8

505.8

江西

4809.0

1074.1

3795.2

1047.7

1872.1

1813.0

1000.0

381.0

山東

5030.9

1391.8

3928.5

1394.3

2834.3

2174.4

1627.6

398.1

河南

3959.8

1172.8

3512.0

1054.4

1838.0

1769.1

1541.5

321.0

湖北

5491.3

1316.2

4310.6

1253.2

2584.1

2187.5

1907.9

487.0

湖南

5260.0

1215.5

3976.1

1190.2

2322.9

2786.2

1705.5

351.5

廣東

8480.8

1135.3

6643.3

1440.8

3423.9

2750.9

1520.8

658.2

廣西

4545.7

616.7

3268.5

898.2

2150.1

1798.9

1364.6

291.9

海南

6552.2

655.9

3744.0

826.6

1919.0

2185.5

1236.1

409.2

重慶

6220.8

1454.5

3498.8

1338.9

2545.0

2087.8

1660.0

442.8

四川

5937.9

1173.8

3368.0

1182.2

2398.8

1599.7

1568.6

434.5

貴州

3792.9

934.7

2760.7

878.1

2408.0

1660.0

1083.5

280.1

云南

3983.4

789.1

3081.1

859.9

2212.8

1772.7

1267.7

283.2

西藏

4330.5

1285.2

2102.6

622.3

1847.7

609.3

460.1

262.6

陜西

4292.5

1141.1

3388.2

1200.8

2005.8

2008.8

1749.4

373.2

甘肅

4253.3

1111.5

3095.0

896.9

1640.7

1710.3

1573.9

342.4

青海

4671.6

1350.6

2990.0

932.0

2671.4

1655.6

1842.0

444.0

寧夏

4234.1

1388.2

3014.3

1067.1

2724.4

2139.5

1727.1

420.4

新疆

4691.6

1456.0

2894.3

1082.8

2274.4

1762.5

1592.6

434.9

數據讀入X=read.table('biao1.2.txt',header=T)

R 函數筆記 | read.table()函數 - 簡書 (jianshu.com)

file填要打開的文件名,如"data"

options填操作

參數功能
header邏輯值,指示表格是否包含文件第一行中的變量名稱
sep分隔數據值的分隔符。默認值為sep =“ ”,表示一個或多個空格、制表符、換行符或回車符。使用sep =“,”來讀取被逗號","分隔的文件,使用sep =“\t”來讀取制表符分隔的文件
row.names一個可選參數,指定一個或多個變量來表示行標識符
col.names如果數據文件的第一行不包含變量名(header = FALSE),則可以使用col.names指定包含變量名的字符向量。如果header = FALSE并且省略了col.names選項,則變量將命名為V1,V2,依此類推。
na.strings指示缺失值代碼的可選字符向量。例如,na.strings = c(“9”,“?”)轉換每個9和?讀取數據時的值為NA
colClasses分配給列的類的可選向量。例如,colClasses = c(“numeric”,“numeric”,“character”,“NULL”,“numeric”)將前兩列讀取為numeric,將第三列讀取為character,跳過第四列,并讀取 第五列為numeric。 如果數據中有五列以上,則第六列重新從colClasses的第一個numeric開始
quote用于分隔包含特殊字符的字符串的字符。默認情況下,這是雙引號"或單引號'
skip在開始讀取數據之前要跳過的文本文件中的行數。此選項對于跳過文件中的標題注釋很有用
stringsAsFactors邏輯值,指示是否應將字符變量轉換為因子。除非被colClasses覆蓋,否則默認值為TRUE。處理大型文本文件時,設置stringsAsFactors = FALSE可以加快處理速度
text指定要處理的文本字符串的字符串
comment.char關閉注釋
X=read.table(file, options)

1.散布矩陣圖

散布矩陣圖在一張圖上給出p個變量相互之間的散點圖,由此可以直觀看出p個變量兩兩之間的相關關系

R語言 pairs()用法及代碼示例 - 純凈天空 (vimsky.com)

pairs(X) #畫散布矩陣圖

R語言中的pairs()函數用于返回一個繪圖矩陣,由每個 DataFrame 對應的散點圖組成。

用法: pairs(data)

從該圖可以看出,食品支出與生活用品及服務支出、教育及文化娛樂支出之間存在顯著線性相關關系,而教育及文化娛樂支出又與居住支出、其他支出之間存在顯著線性相關關系,等等。

2.均值條形圖

均值條形圖常用來比較各個樣本的樣本均值的大小,也可以比較各個變量的樣本均值的大小。

R語言:使用barplot()繪制柱狀圖(條形圖) - 知乎 (zhihu.com)

barplot(apply(X,1,mean),las=3)
barplot(height,              # 柱子的高度names.arg = NULL,    # 柱子的名稱col = NULL,          # 柱子的填充顏色border = par("fg"),  # 柱子的輪廓顏色main = NULL,         # 柱狀圖主標題xlab = NULL,         # X軸標簽ylab = NULL,         # Y軸標簽xlim = NULL,         # X軸取值范圍ylim = NULL,         # Y軸取值范圍horiz = FALSE,       # 柱子是否為水平legend.text = NULL,  # 圖例文本beside = FALSE,      # 柱子是否為平行放置)

但是這里我們是直接用的apply函數R 數據處理(二十)—— apply - 知乎 (zhihu.com)

apply(X, MARGIN, FUN, ...)
  • X: 數組、矩陣、數據框,數據至少是二維的
  • MARGIN: 按行計算或按列計算,1?表示按行,2?表示按列
  • FUN: 自定義的調用函數
  • ...:?FUN?的可選參數

組合一下,有:

按行做均值條圖
barplot(apply(X,1,mean))

按列做均值條圖
barplot(apply(X,2,mean))

這里圖1就是按行的,圖二按列

?3.箱線圖

箱線圖可以比較清晰地展示數據的分布特征。

R語言 boxplo函數用法及箱線圖介紹_r gg_boxplot_col()-CSDN博客

boxplot(X) #按列做垂直箱線圖
boxplot(X,horizontal=T)#水平箱線圖

boxplot(x, ..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par("fg"), col = NULL, log = "", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)

主要參數的含義:

x: 向量,列表或數據框。

formula: 公式,形如y~grp,其中y為向量,grp是數據的分組,通常為因子。

data: 數據框或列表,用于提供公式中的數據。

range: 數值,默認為1.5,表示觸須的范圍,即range × (Q3 - Q1)

width: 箱體的相對寬度,當有多個箱體時,有效。

varwidth: 邏輯值,控制箱體的寬度, 只有圖中有多個箱體時才發揮作用,默認為FALSE, 所有箱體的寬度相同,當其值為TRUE時,代表每個箱體的樣本量作為其相對寬度

notch: 邏輯值,如果該參數設置為TRUE,則在箱體兩側會出現凹口。默認為FALSE。

outline: 邏輯值,如果該參數設置為FALSE,則箱線圖中不會繪制離群值。默認為TRUE。

names:繪制在每個箱線圖下方的分組標簽。

plot : 邏輯值,是否繪制箱線圖,如設置為FALSE,則不繪制箱線圖,而給出繪制箱線圖的相關信息,如5個點的信息等。

border:箱線圖的邊框顏色。

col:箱線圖的填充色。

horizontal:邏輯值,指定箱線圖是否水平繪制,默認為FALSE。

4.星相圖

星相圖是雷達圖的多元表現形式,它將各個觀測樣品點表現為一個圖形,n個樣本點就有n個圖形,每個圖形的每個角表示一個變量。?

R stars 星圖(蜘蛛圖/雷達圖)和線段圖 - 純凈天空 (vimsky.com)

stars(X,full=F,key.loc=c(13,1.5))
stars(x, full = TRUE, scale = TRUE, radius = TRUE,labels = dimnames(x)[[1]], locations = NULL,nrow = NULL, ncol = NULL, len = 1,key.loc = NULL, key.labels = dimnames(x)[[2]],key.xpd = TRUE,xlim = NULL, ylim = NULL, flip.labels = NULL,draw.segments = FALSE,col.segments = 1:n.seg, col.stars = NA, col.lines = NA,axes = FALSE, frame.plot = axes,main = NULL, sub = NULL, xlab = "", ylab = "",cex = 0.8, lwd = 0.25, lty = par("lty"), xpd = FALSE,mar = pmin(par("mar"),1.1+ c(2*axes+ (xlab != ""),2*axes+ (ylab != ""), 1, 0)),add = FALSE, plot = TRUE, ...)
x

數據的矩陣或 DataFrame 。將為?x?的每一行生成一個星形圖或線段圖。允許缺失值 (?NA?),但它們被視為 0(縮放后,如果相關的話)。

full

邏輯標志:如果TRUE,線段圖將占據一整圈。否則,它們僅占據(上)半圓。

scale

邏輯標志:如果?TRUE?,則數據矩陣的列獨立縮放,以便每列中的最大值為 1,最小值為 0。如果?FALSE?,則假設數據已被其他某個縮放算法范圍??。

radius

邏輯標志:在TRUE中,將繪制數據中每個變量對應的半徑。

labels

用于標記圖的字符串向量。與 S 函數?stars?不同,如果?labels = NULL?則不會嘗試構造標簽。

locations

具有用于放置每個線段圖的 x 和 y 坐標的兩列矩陣;或長度為 2 的數字,此時所有圖都應疊加(對于“蜘蛛圖”)。默認情況下,?locations = NULL?,線段圖將放置在矩形網格中。

nrow, ncol

給出當?locations?為?NULL?時要使用的行數和列數的整數。默認情況下,?nrow == ncol?,將使用方形布局。

len

半徑或線段長度的比例因子。

key.loc

帶有單位鍵的 x 和 y 坐標的向量。

key.labels

用于標記單位鍵段的字符串向量。如果省略,則使用?dimnames(x)?的第二個組件(如果可用)。

key.xpd

單位鍵的剪輯開關(繪圖和標簽),請參閱par("xpd")

xlim

具有要繪制的 x 坐標范圍的向量。

ylim

具有要繪制的 y 坐標范圍的向量。

flip.labels

邏輯指示標簽位置是否應在圖表之間上下翻轉。默認為有點智能的啟發式。

draw.segments

合乎邏輯的。如TRUE畫一個線段圖。

col.segments

顏色向量(整數或字符,請參閱?par?),每個向量指定其中一個段(變量)的顏色。如果?draw.segments = FALSE?則忽略。

col.stars

顏色向量(整數或字符,請參閱?par?),每個向量指定其中一顆星星(案例)的顏色。如果?draw.segments = TRUE?則忽略。

col.lines

顏色向量(整數或字符,請參閱?par?),每個向量指定其中一條線(案例)的顏色。如果?draw.segments = TRUE?則忽略。

axes

邏輯標志:是否將?TRUE?軸添加到圖中。

frame.plot

邏輯標志:如果?TRUE?,則繪圖區域被加框。

main

情節的主要標題。

sub

情節的副標題。

xlab

x 軸的標簽。

ylab

y 軸的標簽。

cex

標簽的字符擴展因子。

lwd

用于繪圖的線寬。

lty

用于繪圖的線型。

xpd

邏輯或 NA 指示是否應進行裁剪,請參閱?par(xpd = .)?。

mar

par(mar = *)?的參數,通常選擇比默認情況更小的邊距。

...

更多參數,傳遞給?plot()?的第一次調用,請參見plot.default,如果?frame.plot?為 true,則傳遞給?box()

add

邏輯上,如果?TRUE?將星星添加到當前繪圖中。

plot

邏輯上,如果?FALSE?,則不會繪制任何內容。

從該圖中可以看出,北京上海天津浙江廣東五個地區的消費支出較高。另外,有些地區在各項消費指標上的支出比較均勻,比如北京上海,有些地方不夠均勻,如西藏新疆。

?5.臉譜圖

運用樣本各變量值構造臉的各部位,通過分析臉部位大小或形狀來分析各樣本數據特征。一般來說,較為豐滿、生動的臉譜代表比較理想的樣品數據。

#加載aplpack包
library(aplpack) 
#按每行7個做臉譜圖
faces(X,ncol.plot=7)

R語言TeachingDemos包 faces函數使用說明 - 愛數吧 (idata8.com)

語法\用法:

faces(xy, which.row, fill = FALSE, nrow, ncol, scale = TRUE, byrow = FALSE, main, labels)


參數說明:

xy :?xy數據矩陣,行表示個體,列表示屬性

which.row :?定義輸入矩陣行的排列

fill :?如果(fill==TRUE),則僅轉換面的第一個nc屬性,nc是xy的列數

nrow :?圖形設備上的面列數

ncol :?面行數

scale :?如果(scale==TRUE),屬性將被規格化

byrow :?如果(byrow==TRUE),則xy將被轉置

main :?標題

labels :?用作面名稱的字符串?

6.調和曲線圖

調和曲線圖是一種利用三角多項式進行作圖的方法,其思想是把高維空間中的一個樣品點對應于二維平面上的一條曲線。這種圖形有利于對樣品進行直觀分類同類樣品的曲線之間比較靠近,而不同類樣品的曲線之間界限分明,非常直觀。?

#加載mvstats包
library(mvstats) 
plot.andrews(X)####也可以直接從鏡像站加載andrews包繪制調和曲線圖
library(andrews)
andrews(X,type=3,clr=5,ymax=3)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/717777.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/717777.shtml
英文地址,請注明出處:http://en.pswp.cn/news/717777.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

歐拉回路(Eulerian Path)

1.定義 如果圖 G G G(有向圖或者無向圖)中所有邊一次僅且一次行遍所有頂點的通路稱作歐拉通路。 如果圖 G G G中所有邊一次僅且一次行遍所有頂點的回路稱作歐拉回路。 具有歐拉回路的圖成為歐拉圖(簡稱 E E E圖)。具有歐拉通路但不具有歐拉回路的圖成為半歐拉圖。 頂點可以經…

【Linux】Linux常用指令介紹

目錄 1、whoami命令 2、pwd命令 3、ls命令 4、cd命令 5、touch命令 6、mkdir命令 7、rm命令 8、man命令 9、cp命令 10、mv命令 11、cat命令 12、more命令 13、less命令 14、head命令 15、tail命令 16、find命令 1、whoami命令 語法:whoani 功能&a…

SpringMVC--03--前端傳數組給后臺

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 案例1乘客個人信息方法1:表單提交,以字段數組接收方法2:表單提交,以BeanListModel接收方法3:將Json對象序…

leetcode移除元素

注意,在本題中,是對原數組進行操作,需要原地刪除指定元素,所以我們可以采用快慢指針來操作。 顧名思義,快慢指針是有兩個指針,一直快指針,一個慢指針。在本題中,快慢指針起點都是0&a…

解鎖人體姿態的秘密:部件親和場(PAF)的革新應用

部件親和場(PAF)原理及其在人體姿態估計中的應用 摘要: 隨著人工智能技術的發展,人體姿態估計在計算機視覺領域受到越來越多的關注。部件親和場(Part Affinity Fields,簡稱PAF)作為一種新興的人體姿態估計技術,通過構建2D向量場來描述人體肢體的方向和位置信息,從而…

Matlab 機器人工具箱 運動學

文章目錄 R.fkine()R.ikine()R.ikine6s()R.ikuncR.jacob0、R.jacobn、R.jacob_dotjtrajctraj參考鏈接 官網:Robotics Toolbox - Peter Corke R.fkine() 正運動學,根據關節坐標求末端執行器位姿 mdl_puma560; % 加載puma560模型 qz % 零角度 qr …

繼承(使用及深入、super、重寫/復寫)--學習JavaEE的day14

day14 一、繼承 概念 Java中的繼承是一個對象獲取父對象的所有屬性和行為的機制 理解:繼承是指一個類(子類)可以繼承另一個類(父類)的屬性和方法 關鍵字extends 優點:減少代碼的冗余 缺點:繼承會增加類與類之間的關系,會增加代碼…

[Unity3d] 網絡開發基礎【個人復習筆記/有不足之處歡迎斧正/侵刪】

TCP/IP TCP/IP協議是一 系列規則(協議)的統稱,他們定義了消息在網絡間進行傳輸的規則 是供已連接互聯網的設備進行通信的通信規則 OSI模型只是一個基本概念,而TCP/IP協議是基于這個概念的具體實現 TCP和UDP協議 TCP:傳輸控制協議,面向連接&#xff0c…

VsCode配置PCL、Open3D自動補全

寫在前面 本文內容 在VsCode上開發PCL、Open3D相關代碼,代碼自動補全 Open3D、PCL的安裝使用見各個版本的Open3D、PCL的編譯、使用教程 平臺/環境 windows11(windows10): visual studio 2022;cmake 3.22; VsCode 通過cmake構建項目; 轉載請…

Excel MATCH函數 兩張順序不同表格,統一排序

目錄 一. 背景二. 添加輔助列,使用MATCH函數生成排序條件三. 效果 一. 背景 有如下圖所示的兩張表格,分別記錄著同一批人的1月份和2月份的工資。表格A和表格B中的姓名列相同,工資列數據不同現在要求參考表格A中的姓名列對表格B中的數據進行排序&#xf…

C語言:預處理

C語言:預處理 預定義符號#define定義常量定義宏宏與函數對比 #操作符##操作符條件編譯頭文件包含庫文件包含本地文件包含嵌套文件包含 預定義符號 C語?設置了?些預定義符號,可以直接使?,預定義符號也是在預處理期間處理的。 __FILE__ //…

多智能體強化學習簡介

基礎概念 什么是多智能體系統 多智能體系統(Multi-Agent System,MAS)是由多個自主智能體組成的系統。這些智能體可以協同工作,也可以獨立行動,以實現各自的目標。在多智能體系統中,每個智能體都有自己的決…

在你的 Vue + Electron 項目里,引入 ESLint

因為我的項目是基于 Electron 平臺的 Web 應用,使用 Vue 3 實現,而且用了 TypeScript,所以,在引入 ESLint 的時候,要考慮好幾種規范的問題。 文章目錄 零、簡介1. 規則2. 配置文件3. 共享配置4. 插件5. 解析器6. 自定義…

Vue開發實例(九)動態路由實現左側菜單導航

之前在【Vue開發實例(六)實現左側菜單導航】文中實現了菜單的導航,本篇是在那個基礎上改造的。 動態路由實現左側菜單導航 一、動態菜單創建二、根據菜單數據來創建路由三、添加路由已加載標記,省的每次點擊菜單都要加載 一、動態…

2021 年 3 月青少年軟編等考 C 語言一級真題解析

目錄 T1. 字符菱形思路分析 T2. 與圓相關的計算思路分析 T3. 蘋果和蟲子 2思路分析 T4. 奇數求和思路分析 T5. 藥房管理思路分析 T1. 字符菱形 給定一個字符,用它構造一個對角線長 5 5 5 個字符,傾斜放置的菱形。 時間限制:1 s 內存限制&a…

3、云原生安全之falco的部署

文章目錄 1、helm安裝2、拉去鏡像失敗與解決3、安裝faclo4、安裝nfs服務器,配置k8s的持久卷4.1、創建nfs服務器,4.2、部署master節點(nsf服務的客戶端)4.3、pv與pvc4.4、假設pv和pvc的配置文件出錯了5、安裝falcosidekick可視化(建議跳過,直接使用6)6、安裝faclo與falco…

【設計模式 01】單例模式

單例模式,是一種創建型設計模式,他的核心思想是保證一個類只有一個實例(即,在整個應用程序中,只存在該類的一個實例對象,而不是創建多個相同類型的對象),并提供一個全局訪問點來訪問…

java012 - Java集合基礎

1、集合基礎 1.1 集合概述 引用數據類型包括:類、接口、數組[] 1.2 ArrayList構造和添加方法 代碼: 空集合對象:[] add() add(int index,E element): 1.3 ArrayList集合常用方法

計算機體系結構安全:對體系結構如何支持安全機制進行調研

一、體系結構支持信任建立和主動防御的技術: 可信3.0 二、體系結構怎么更好的支持信任建立和主動防御 2.1 支持信任建立 一、以手機芯片舉例,用智能手機的芯片作為信任根,確保應用程序和敏感數據受到保護。 二、啟動時驗證操作系統和應用…

Stable Diffusion 模型分享:Henmix_Real(人像、真實、寫真、亞洲面孔)

本文收錄于《AI繪畫從入門到精通》專欄,專欄總目錄:點這里。 文章目錄 模型介紹生成案例案例一案例二案例三案例四案例五案例六案例七案例八下載地址模型介紹 作者述:這個模型試圖改