R語言進行聚類分析

目錄

簡述6種系統聚類法

實驗實例和數據資料:

上機實驗步驟:

進行最短距離聚類:

進行最長距離聚類:

進行中間距離聚類:

進行類平均法聚類:

進行重心法聚類:

進行ward.D聚類:

進行ward.D2聚類:


簡述6種系統聚類法

(一)單鏈接聚類法:也稱為最小距離聚類法,它通過計算兩個簇中最近的成員之間的距離來確定簇之間的距離。該方法通常會產生長而細的簇,對異常值敏感。

(二)完全鏈接聚類法:也稱為最大距離聚類法,它通過計算兩個簇中最遠的成員之間的距離來確定簇之間的距離。該方法通常會產生緊湊的簇,對異常值不敏感。

(三)平均鏈接聚類法:它通過計算兩個簇中所有成員之間的平均距離來確定簇之間的距離。該方法可以在一定程度上平衡單鏈接和完全鏈接的缺點。

(四)中心鏈接聚類法:它通過計算兩個簇的質心之間的距離來確定簇之間的距離。質心是指簇中所有成員的平均值。該方法產生的簇具有更加均衡的大小。

(五)Ward聚類法:它基于最小方差準則,通過計算將兩個簇合并后整體的方差增加量來確定簇之間的距離。該方法傾向于產生方差相對較小的簇。

(六)類平均聚類法:它通過計算兩個簇中所有成員之間的平均距離來確定簇之間的距離。類平均聚類法與平均鏈接聚類法類似,但不同于平均鏈接聚類法使用所有成員之間的距離,而是只使用兩個簇之間的成員之間的距離。

實驗實例和數據資料:

P2122)?為了比較我國?31個省、市、自治區?1996年和2007(數據見本章例7.2d3.1)城鎮居民生活消費的分布規律,根據調查資料作區域消費類型劃分。并將1996年和2007年的數據進行對比分析。今收集了八個反映城鎮居民生活消費結構的指標(1996年數據見表1和表2)

表1?八個反映城鎮居民生活消費結構的指標

符號

指標

單位

X1

X2

X3

X4

X5

X6

X7

X8

人均食品支出

人均衣著商品支出

人均家庭設備用品及服務支出

人均醫療保健支出

人均交通和通信支出

人均娛樂教育文化服務支出

人均居住支出

人均雜項商品和服務支出

/

/

/

/

/

/

/

/

表2?1996年全國31個省、市、自治區城鎮居民消費數據

X1

X2

X3

X4

X5

X6

X7

X8

北京

8170.22

2794.87

1974.25

1717.58

4106.04

3984.86

2125.99

1401.08

天津

7943.06

1950.68

1205.62

1694.29

3468.86

2353.43

2088.62

1007.31

河北

4404.4

1488.11

977.46

1117.3

2149.57

1550.63

1526.28

426.29

山西

3676.65

1627.53

870.91

1020.61

1775.3

2065.44

1612.36

516.84

內蒙古

6117.93

2777.25

1233.39

1394.8

2719.92

2111

1951.05?

943.72

遼寧

5803.9

2100.71

1145.57

1343.05

2589.18

2258.46

1936.10?

852.69

吉林

4658.13

1961.2

908.43

1692.11

2217.87

1935.04?

1932.24

627.3

黑龍江

5069.89

1803.45

796.38

1334.8

1661.35

1396.38

1543.29?

556.16

上海

9822.88

2032.28

1705.47

1350.28

4736.36

4122.07

2847.88

1537.78

江蘇

7074.11

2013

1378.85

1122

3135

3290

1564.3

794.00?

浙江

8008.16

2235.21

1400.57

1244.37

4568.32

2848.75

2004.69

947.13

安徽

6370.23

1687.49

898.55

869.89

2411.16

1904.15

1633.55

480.16

福建

7424.67

1685.07

1416.94

935.5

3219.46

2448.36

2013.53

949.19

江西

5221.1

1566.49

1004.15

672.5

1812.78

1671.24

1414.89

471.58

山東

5625.94

2277.03

1269.65

1109.37

2474.83

1909.84

1780.07

665.52

河南

4913.87

1916.99

1281.06

1054.54

1768.28

1911.16

1315.28

660.81

湖北

6259.22

1881.85

1059.22

1033.46

1745.05

1922.83

1456.30?

391.57

湖南

5583.99

1520.35

1146.65

1078.82

2409.83

2080.46

1529.50?

537.51

廣東

8856.91

1614.87

1539.09

1122.71

4544.21

3222.40?

2339.12

893.95

廣西

5841.16

1015.88

1086.46

776.26

2564.92

2093.99

1622.50?

386.46

海南

6979.22

932.63

1030.79

734.28

2005.73

1923.48

1578.65

408.26

重慶

7245.12

2333.81

1325.91

1245.33

1976.19

1722.66

1376.15

588.70?

四川

6471.84

1727.92

1196.65

1019.04

2185.94

1877.55

1321.54

542.99

貴州

4915.02

1401.85

1083.77

633.72

1870.08

1950.28

1496.49

351.66

云南

5741.01

1356.91

987.24

1085.46

2197.73

2045.29

1384.91

357.61

西藏

5889.48

1528.14

541.46

617.97

500.6

1551.34

963.99

638.89

陜西

6075.58

1915.33

1060.49

1310.19

2019.08

2208.06

1465.81

626.16

甘肅

5162.87

1747.32

939.48

1117.42

1503.61

1547.65

1596

406.37

青海

4777.1

1675.06

890.08

813.13

1742.96

1471.98

1684.78

484.41

寧夏

4895.2

1737.21

1001.82

1158.83

2503.65

1868.42

1497.98

657.99

新疆

5323.5

2036.94

977.8

1179.77

2210.25

1597.99

1275.35

604.55

試對該數據進行聚類分析。???????

上機實驗步驟:

1.準備數據:根據提供的消費數據,將數據保存在一個Excel文件中,并確保每個地區在所有指標上都有完整的數據。將文件命名為"1996年數據.xlsx"。

2.?加載數據并計算距離矩陣

data=read.xlsx('1996年數據.xlsx',rowNames=T);data??
dist_matrix?<-?dist(data)??

結果如下

進行最短距離聚類:

j1?<-?hclust(dist_matrix,?method?=?"single")??
plot(j1,?main?=?"最短距離聚類樹狀圖")??

結果如下

進行最長距離聚類:

j2?<-?hclust(dist_matrix,?method?=?"complete")??
plot(j2,?main?=?"最長距離聚類樹狀圖")??

結果如下

進行中間距離聚類:

j3?<-?hclust(dist_matrix,?method?=?"median")??
plot(j3,?main?=?"中間距離聚類樹狀圖")??

結果如下

進行類平均法聚類:

j4?<-?hclust(dist_matrix,?method?=?"average")??
plot(j4,?main?=?"類平均法聚類樹狀圖")??

結果如下

進行重心法聚類:

j5?<-?hclust(dist_matrix,?method?=?"centroid")??
plot(j5,?main?=?"重心法聚類樹狀圖")

結果如下

進行ward.D聚類:

j6?<-?hclust(dist_matrix,?method?=?"ward.D")??
plot(j6,?main?=?"ward.D聚類樹狀圖")??

結果如下

進行ward.D2聚類:

j7?<-?hclust(dist_matrix,?method?=?"ward.D2")??
plot(j7,?main?=?"ward.D2聚類樹狀圖")?

結果如下

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/900704.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/900704.shtml
英文地址,請注明出處:http://en.pswp.cn/news/900704.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【回眸】Linux 內核 (十四)進程間通訊 之 信號量

前言 信號量概念 信號量常用API 1.創建/獲取一個信號量 2.改變信號量的值 3. 控制信號量 信號量函數調用 運行結果展示 前言 上一篇文章介紹的共享內存有局限性,如:同步與互斥問題、內存管理復雜性問題、數據結構限制問題、可移植性差問題、調試困難問題。本篇博文介…

記錄IBM服務器檢測到備份GPT損壞警告排查解決過程

服務器設備&#xff1a;IBM x3550 M4 Server IMM默認IP地址&#xff1a;192.168.70.125 用戶名&#xff1a;USERID 密碼&#xff1a;PASSW0RD&#xff08;注意是零0&#xff09; 操作系統&#xff1a;Windows Hyper-V Server 2016 IMM Web System Status Warning&#xff1…

“Pseudo Global Warming”:偽全球變暖PGW

“Pseudo Global Warming”&#xff1a;偽全球變暖PGW PGW方法概述&#x1f50d; 一、PGW 方法的定義&#x1f9e0; 二、PGW 方法的基本原理&#x1f6e0;? 三、PGW 方法的主要步驟&#x1f4c8; 四、PGW 模擬時常涉及的變量&#x1f4ca; 五、PGW 方法的優/缺點&#x1f4da;…

2025-04-06 Unity Editor 2 —— GUILayout

文章目錄 常用組件1 Label 文本標簽2 TextField / TextArea / PasswordField 輸入框3 Butto / RepeatButton 按鈕4 Horizontal / Vertical 方向布局5 Box 自動布局框6 ScrollView 滾動視圖7 Horizontal / VerticalSlider 滑動條8 Area GUI 區域9 Window 窗口10 Toolbar 工具欄1…

Qt 交叉編譯詳細配置指南

一、Qt 交叉編譯詳細配置 1. 準備工作 1.1 安裝交叉編譯工具鏈 # 例如安裝ARM工具鏈(Ubuntu/Debian) sudo apt-get install gcc-arm-linux-gnueabihf g++-arm-linux-gnueabihf# 或者64位ARM sudo apt-get install gcc-aarch64-linux-gnu g++-aarch64-linux-gnu 1.2 準備目標…

用PointNet++訓練自己的數據集(語義分割模型semseg)

&#xff08;1&#xff09;訓練部件分割&#xff08;partseg&#xff09;模型和檢測自己點云并將結果保存txt&#xff0c;請看博主上兩篇文章 &#xff08;2&#xff09;本文背景是將pipe點云上的缺陷和本體檢測出來&#xff0c;即1種語義場景&#xff08;pipe&#xff09;&…

kotlin中主構造函數是什么

一 Kotlin 中的主構造函數 主構造函數&#xff08;Primary Constructor&#xff09;是 Kotlin 類聲明的一部分&#xff0c;用于在 創建對象時初始化類的屬性。它不像 Java 那樣是一個函數體&#xff0c;而是緊跟在類名后面。 主構造函數的基本定義 class Person(val name: S…

PHP 過濾器

PHP 過濾器 引言 PHP作為一種廣泛使用的服務器端腳本語言&#xff0c;提供了強大的數據處理能力。在處理數據時&#xff0c;確保數據的安全性和準確性至關重要。PHP過濾器&#xff08;Filters&#xff09;就是用來對數據進行預處理和后處理的工具。本文將詳細介紹PHP過濾器的…

【WebRTC】開源項目Webrtc-streamer介紹

WebRTC-Streamer 這是一個用于通過簡單的信令機制&#xff08;參見 api&#xff09;流式傳輸 WebRTC 媒體源的實驗項目&#xff0c;支持以下媒體源&#xff1a; 捕獲設備 屏幕捕獲 mkv 文件 RMTP/RTSP 源 同時該項目也兼容 WHEP 接口。 注意 * 在線演示已停止&#xff0c…

【Java設計模式】第9章 原型模式講解

9. 原型模式 9.1 原型模式講解 定義:通過拷貝原型實例創建新對象,無需調用構造函數。特點: 創建型模式無需了解創建細節適用場景: 類初始化消耗資源多對象創建過程繁瑣(如屬性賦值復雜)循環體中需創建大量對象優點: 性能優于直接new簡化創建流程缺點: 必須實現clone()…

【Java集合】LinkedList源碼深度分析

參考筆記&#xff1a;java LinkedList 源碼分析&#xff08;通俗易懂)_linkedlist源碼分析-CSDN博客 目錄 1.前言 2.LinkedList簡介 3.LinkedList的底層實現 4.LinkedList 與 ArrayList 的對比 4.1 如何選擇 4.2 對比圖 5.LinkedList 源碼Debug 5.1 add(E e) &#xff…

openssl源碼分析之加密模式(modes)

openssl實現分組加密模式&#xff08;例如AES128-CBC的CBC部分&#xff09;的模塊名字叫做modes&#xff0c;源代碼位于 https://gitee.com/gh_mirrors/openssl/tree/master/crypto/modes 博主又打不開github了TT&#xff0c;只能找個gitee鏡像 頭文件是modes.h。 該模塊目前…

Java 搭建 MC 1.18.2 Forge 開發環境

推薦使用 IDEA 插件 Minecraft Development 進行創建項目 創建完成后即可進行 MOD 開發。 但是關于 1.18.2 的開發教程太少&#xff0c;因此自己研究了一套寫法&#xff0c;寫法并非是最優的但是是探索開發MOD中的一次筆記和記錄 GITHUB: https://github.com/zimoyin/zhenfa…

nginx如何實現負載均衡?

Nginx 是一款高性能的 Web 服務器和反向代理服務器&#xff0c;它可以通過配置實現負載均衡功能。以下是實現負載均衡的詳細步驟和方法&#xff1a; 1. 基本概念 負載均衡是將客戶端請求分發到多個后端服務器上&#xff0c;以提高系統的可用性和性能。Nginx 支持多種負載均衡策…

深度學習天崩開局

李沐大神的d2l包導入&#xff0c; 這玩意需要python311版本&#xff0c;我現在版本已經313了&#xff0c;作為一個天生要強的男人&#xff0c;我是堅決不向低版本低頭的。 然后我就研究啊&#xff0c;各種翻資料啊&#xff0c;然后deepseek加豆包都翻爛了&#xff0c; 最終所…

docker部署jenkins并成功自動化部署微服務

一、環境版本清單&#xff1a; docker 26.1.4JDK 17.0.28Mysql 8.0.27Redis 6.0.5nacos 2.5.1maven 3.8.8jenkins 2.492.2 二、服務架構&#xff1a;有gateway&#xff0c;archives&#xff0c;system這三個服務 三、部署步驟 四、安裝linux 五、在linux上安裝redis&#…

MPDrive:利用基于標記的提示學習提高自動駕駛的空間理解能力

25年4月來自南方科技大學、百度、英國 KCL和琶洲實驗室&#xff08;廣東 AI 和數字經濟實驗室&#xff09;的論文“MPDrive: Improving Spatial Understanding with Marker-Based Prompt Learning for Autonomous Driving”。 自動駕駛視覺問答&#xff08;AD-VQA&#xff09;…

Halcon圖像采集

Halcon是一款強大的機器視覺軟件&#xff0c;結合C#可以開發出功能完善的視覺應用程序。 基本設置 確保已經安裝了Halcon和Halcon的.NET庫&#xff08;HalconDotNet&#xff09;。 1. 添加引用 在C#項目中&#xff0c;需要添加對HalconDotNet.dll的引用&#xff1a; 右鍵點…

Win10定時任務計劃無法顯示要執行的EXE任務程序界面,問題解決辦法

用C#開發的一款WINFORM程序&#xff0c;在電腦測試一切順利&#xff0c;運行結果正確。但用電腦的定時任務執行時&#xff0c;程序界面不顯示&#xff0c;重啟電腦、各種試都不行&#xff0c;最終問題解決。 解決辦法&#xff1a; 要選“只在用戶登陸時運行”&#xff0c;才能執…

Navicat和PLSQL在oracle 使用語句報ORA-00911: 無效字符

后面我發現可能是在復制SQL語句中有中文&#xff0c;但是環境變量未配置中文環境。 因為Oracle的語法解析器特別嚴格&#xff0c;就會報出以上的錯誤出來。 SQL語句錯誤&#xff0c;存在中文字符或者sql語句空格導致&#xff0c;去掉即可解決。 我重新寫語句&#xff0c;發現…