聚類與回歸

聚類

聚類屬于非監督式學習(無監督學習),往往不知道因變量。

通過觀察學習,將數據分割成多個簇。

回歸

回歸屬于監督式學習(有監督學習),知道因變量。

通過有標簽樣本的學習分類器

聚類和回歸的區別

在數據分類過程中,我們可以直接知道回歸對應的具體類別名,但是在聚類過程中,我們只能知道聚類對應的類別與xxx是同一種類別。

比如:我們在使用分類處理一些水果時,我們可以知道某一個水果具體是什么水果,但是聚類我們只能知道這個水果和其他的某些水果是同一種水果,但是我們卻不能知道具體的水果類型名是什么。

聚類的基本方法有三大類:

劃分方法(K均值、K-Means)

通過反復迭代,先隨機分配均值點,?根據均值點形成聚簇,形成聚簇之后,再調整均值點。調整均值點后,再進一步反復進行迭代,最后找到我們相應的聚簇。

層次方法(層次聚類法)

凝聚的(agglomeration)和分裂的(divisive)層次聚類圖示

層次聚類有兩種方法,一種是自底向上的方法,這種方法稱為凝聚法。另一種方法是自下而上的方法,該方法又稱為劃分的方法。

?凝聚法的過程:我們通過水來凝結成冰。首先根據數據進行相似性計算,把相似的數據形成一個簇,形成了各種小簇,進一步計算簇和簇之間的相似性,如果簇和簇之間的相似性更高,將他們合并形成更大的簇。從?向上凝聚,形成我們想要的一個聚簇的一個結束條件時,得到我們想要的一個聚簇(層次聚類的結束條件有很多方法,比如從?向上進行聚類時,當聚到第k個聚簇的時候,我們就停止迭代;另外一種,我們當進行迭代時,我們數據的相似性足夠高,越往上走,聚簇和聚簇的相似性就會越來越低,當相似性的閾值低到一定程度時,就可以認為我的一個層次聚類停止,如此一來就得到了相應的聚簇,即為我們的層次聚類)

霍普金斯統計量

假如求出來的霍普金斯統計量數據接近1,這說明比較符合聚類的要求;若霍普金斯統計量接近0.5,則說明數據接近于均勻分布,不適合對其進行?均勻分布。

聚類的大致流程:

1、通過計算霍普金斯統計量判斷數據質量,判斷當前數據是否需要聚類

2、通過使用一些方法,如:肘方法。來計算我們需要聚簇的k的數量。

3、在了解了k的數量以后,使用相應的k均值,或者是層次聚類法進行聚類

4、聚類結束后,對聚類的結果進行評估,對于聚類的評估方法通常有兩種方法,一種是外在方法,類似于分類,需要有一個基準,用來評價聚類結果的準確率;一種是內在方法,通過我們的輪廓系數,來評價聚類質量的好壞。輪廓系數越接近1,聚類的效果就越好;第三種,聚類中常見的四種特征。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/36019.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/36019.shtml
英文地址,請注明出處:http://en.pswp.cn/news/36019.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

前端實現文件預覽功能

前端實現文件預覽功能 ? 需求:實現一個在線預覽pdf、excel、word、圖片等文件的功能。 介紹:支持pdf、xlsx、docx、jpg、png、jpeg。 以下使用Vue3代碼實現所有功能,建議以下的預覽文件標簽可以在外層包裹一層彈窗。 ? 圖片預覽 iframe標簽…

前端雜項-個人總結八股文的背誦方案

個人總結八股文的背誦方案 URL到顯示網頁的過程 瀏覽器解析URL,獲取協議,主機名,端口號,路徑等信息,并通過DNS查詢將主機名轉換為對應的IP地址瀏覽器與服務器建立TCP,進行三次握手。瀏覽器向服務器發送HT…

枚舉緩存工具

此文章為筆記,為閱讀其他文章的感受、補充、記錄、練習、匯總,非原創,感謝每個知識分享者。 文章目錄 1. 背景2. 枚舉緩存3. 樣例展示4. 性能對比5. 總結 本文通過幾種樣例展示如何高效優雅的使用java枚舉消除冗余代碼。 1. 背景 枚舉在系統…

不需要用@Param注解與需要用@Param注解的情況

不需要用Param注解: 1.只有一個參數時,不需要用Param注解。此時在不使用Parma注解的情況下,sql語句中的參數占位符名稱直接使用任何名稱均可; 2.方法參數是引用數據類型的情況下,不需要用Param注解。 需要用Param注…

QT生成Word PDF文檔

需求:將軟件處理的結果保存為一個報告文檔,文檔中包含表格、圖片、文字,格式為word的.doc和.pdf。生成word是為了便于用戶編輯。 開發環境:qt4.8.4vs2010 在qt的官網上對于pdf的操作介紹如下:http://qt-project.org/…

華為認證 | H3C廠商證書,含金量有多高?

華為H3C認證是中國第一家建立國際規范的完整的網絡技術認證體系,它的作用是不言而喻的,工作上它能給你帶來技能加分。 那么H3C認證網絡工程師證書含金量怎么樣呢?下面我們就來了解一下吧。 01 H3C認證網絡工程師證書含金量 全面覆蓋H3C相關…

微服務Eureka注冊中心

目錄 一、Eureka的結構和作用 二、搭建eureka-server 三、服務注冊 四、服務發現 假如我們的服務提供者user-service部署了多個實例,如圖: 存在的問題: order-service在發起遠程調用的時候,該如何得知user-service實例的ip地址…

深度學習快速入門系列---損失函數

在深度學習中,損失函數的作用是量化預測值和真實值之間的差異,使得網絡模型可以朝著真實值的方向預測,損失函數通過衡量模型預測結果與真實標簽之間的差異,反映模型的性能。同時損失函數作為一個可優化的目標函數,通過…

10個微服務設計模式

微服務設計模式是一種指導微服務架構設計和開發的一系列原則和實踐。微服務設計模式的目的是為了解決微服務架構中遇到的一些常見的問題和挑戰,比如服務劃分、服務通信、服務治理、服務測試等。微服務設計模式可以幫助我們構建出高效、可靠、可擴展、可維護的微服務…

九耶丨閣瑞鈦倫特-井字棋html5代碼

你想了解關于井字棋&#xff08;Tic-Tac-Toe&#xff09;的HTML代碼嗎&#xff1f;以下是一個簡單的井子棋的HTML代碼示例&#xff1a; <!DOCTYPE html> <html> <head><title>Tic-Tac-Toe</title><style>.board {display: flex;flex-wrap…

使用AT命令操作Modem 3G/4G模塊

1. 引言 AT命令是一種通信協議&#xff0c;用于控制和配置各種設備&#xff0c;尤其在通信領域中具有重要性。它的名稱來源于"ATtention"&#xff08;注意&#xff09;&#xff0c;因為命令通常以"AT"開頭。AT命令最早被用于調制解調器&#xff0c;用于與…

redis學習筆記(三)

文章目錄 key操作&#xff08;1&#xff09;查找鍵&#xff08;2&#xff09;判斷鍵是否存在&#xff08;3&#xff09;查看鍵的的值的數據類型&#xff08;4&#xff09;刪除鍵以及鍵對應的值&#xff08;5&#xff09;查看鍵的有效期&#xff08;6&#xff09;設置key的有效期…

springboot整合rabbitmq

rabbitmq的七種模式 Hello word 客戶端引入依賴 <!--rabbitmq 依賴客戶端--><dependency><groupId>com.rabbitmq</groupId><artifactId>amqp-client</artifactId><version>5.8.0</version></dependency> 生產者 imp…

STM32 LoRa源碼解讀

目錄結構&#xff1a; SX1278 |-- include | |-- fifo.h | |-- lora.h | |-- platform.h | |-- radio.h | |-- spi.h | |-- sx1276.h | |-- sx1276Fsk.h | |-- sx1276FskMisc.h | |-- sx1276Hal.h | |-- sx1276LoRa.h | -- sx1276LoRaMisc.h – src |-- fifo.c |-- lora.c |-- …

【解析postman工具的使用---基礎篇】

postman前端請求詳解 主界面1.常見類型的接口請求1.1 查詢參數的接口請求1.1.1 什么是查詢參數?1.1.2 postman如何請求 1.2 ?表單類型的接口請求1.2.1 復習下http請求1.2.2? 什么是表單 1.3 上傳文件的表單請求1.4? json類型的接口請求 2. 響應接口數據分析2.1 postman的響…

紅帽RHCA考試內容解析

紅帽RHCA考試內容解析&#xff1a;最新的RHCA有3大方向體系&#xff0c;考試內容分別為&#xff1a; 一、Platform 平臺技術 RH442&#xff1a;性能調優 使用紅帽企業Linux和紅帽網絡提供的工具來學習Linux的性能調優和規劃的技巧及方法&#xff0c;學習系統架構&#xff0c;…

什么是DNS欺騙及如何進行DNS欺騙

提示&#xff1a;文章寫完后&#xff0c;目錄可以自動生成&#xff0c;如何生成可參考右邊的幫助文檔 文章目錄 前言一、什么是 DNS 欺騙&#xff1f;二、開始1.配置2.Ettercap啟動3.操作 總結 前言 我已經離開了一段時間&#xff0c;我現在回來了&#xff0c;我終于在做一個教…

【AI】p54-p58導航網絡、藍圖和AI樹實現AI隨機移動和跟隨移動、靠近玩家揮拳、AI跟隨樣條線移動思路

p54-p58導航網絡、藍圖和AI樹實現AI隨機移動和跟隨移動、靠近玩家揮拳、AI跟隨樣條線移動思路 p54導航網格p55藍圖實現AI隨機移動和跟隨移動AI Move To&#xff08;AI進行移動&#xff09;Get Random Pointln Navigable Radius&#xff08;獲取可導航半徑內的隨機點&#xff09…

Java基礎十 - 設計模式

一、單例 1. 創建 餓漢式 package basic;public class ESingleton {// 先私有化靜態實例private static ESingleton eSingleton new ESingleton();// 私有化構造方法&#xff0c;防止外部實例化private ESingleton(){};// 提供全局訪問方法public static ESingleton geteSi…

時序預測 | MATLAB實現基于LSTM長短期記憶神經網絡的時間序列預測-遞歸預測未來(多指標評價)

時序預測 | MATLAB實現基于LSTM長短期記憶神經網絡的時間序列預測-遞歸預測未來(多指標評價) 目錄 時序預測 | MATLAB實現基于LSTM長短期記憶神經網絡的時間序列預測-遞歸預測未來(多指標評價)預測結果基本介紹程序設計參考資料 預測結果 基本介紹 Matlab實現LSTM長短期記憶神經…