聚類里面的一些相關概念介紹闡述

一、性能度量

  • 外部指標:聚類結果與某個“參考模型”進行比較;
    • Jaccard?系數:?J(h_i,h_j)=\frac{N^{11}}{N^{01}+N^{10}+N^{11}}其中的 0,1 表示樣本是否屬于某類簇;
    • FM?指數:FM=\sqrt{\frac{TP}{TP+FP}\times\frac{TP}{TP+FN}}其中 TP 表示樣本在兩個聚類結果中都是同一類簇,FP 表示在其中一個聚類結果中同一類簇,在另一結果反之,FN 也是;
    • Rand?指數
  • 內部指標:直接考察聚類結果;
    • DB?指數、Dunn?指數

二、距離計算

  • 非負性、同一性、對稱性、直遞性(就是類似三角形兩邊之和大于第三邊的理解,按三個頂點距離來理解)。
  • 閔可夫斯基距離(用于有序屬性)、歐氏距離、曼哈頓距離(和數學里面的公式一致)。

三、原型聚類

  • k 均值算法:將數據劃分為 K 個互不重疊的簇,使得同一簇內的數據點盡可能相似,不同簇的數據點盡可能不同,其目標是要最小化簇內平方和:

\mathrm{WCSS}=\sum^{K}_{i=1}\sum_{x\in C_i}||x-\mu_i||^2

????????其中 K 是預設的簇(類別)的數量,C_i 就是第 i 個簇,\mu_i 就是第 i 個簇的質心,x 是數據點。

  • 學習向量量化:目標是找到一組原型向量(每個原型對應一個類別),使得每個原型盡可能靠近其所屬類別的樣本,以及不同類別的原型盡可能遠離彼此;最終分類時,新樣本被分配給最近原型對應的類別。
  • 高斯混合聚類:它假設所有數據點是由多個高斯分布(正態分布)混合生成的。與 K-means 等硬聚類算法不同,GMM 允許一個數據點以一定概率屬于多個簇,因此更適合處理重疊簇非球形簇的復雜數據分布。

四、密度聚類

  • 基于數據點空間分布的聚類方法,其核心思想是將高密度區域的數據點劃分為同一簇,并識別低密度區域作為簇間的分隔。與K均值等基于距離的算法不同,密度聚類無需預先指定簇數量,且能發現任意形狀的簇,同時有效處理噪聲和離群點。

五、層次聚類

  • 通過逐層分解或合并數據來構建聚類結構的算法,不需要預先指定簇的數量(K 值),最終結果可以用樹狀圖直觀展示;
  • 凝聚式(自底向上):
    • 初始時,每個數據點視為一個獨立的簇;
    • 逐步合并距離最近的簇,直到所有點聚為一類;
  • 分裂式(自頂向下):
    • 初始時,所有數據點屬于一個簇;
    • 遞歸地分裂簇,直到每個點單獨成簇(計算復雜度高,較少使用);

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90848.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90848.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90848.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mmap機制

先看這個 MMAP 機制通俗易懂-CSDN博客 一句話 **mmap(memory map)是操作系統提供的“把文件或設備直接映射到進程虛擬地址空間”的機制,Java 里對應 `MappedByteBuffer`。** --- ### 1. 技術本質 - 系統調用:`mmap()`(POSIX)、`CreateFileMapping`(Windows)。 …

嵌入式硬件篇---驅動板

制作 ESP32 驅動板的核心是 “搭建 ESP32 與外設之間的橋梁”—— 因為 ESP32 的 GPIO 引腳輸出電流很小(最大 20mA),無法直接驅動大功率設備(如電機、繼電器、電磁閥等),驅動板的作用就是放大電流 / 功率&…

UniappDay01

1.技術架構2.創建uniapp項目 通過HBuilderX創建 官網安裝創建uniapp vue3項目安裝uniapp vue3的編譯器在工具欄啟動微信小程序開啟服務端口模擬器窗口分離和置頂 通過命令行創建 3.pages.json和tabbar案例 pages.json用來配置路由,導航欄,tabbar等頁面類…

子空間投影,投影矩陣,最小二乘法

一、子空間投影 1.1 投影與誤差向量b 在 向量a 上的投影即 a 上離 b 最近的點: paTbaTaa p \frac{a^T b}{a^Ta}a paTaaTb?a 我們記 誤差 e b - p,顯然誤差e 和 a 是正交的。 1.2 投影矩陣向量b 在子空間S上的投影是S中離b 最近的向量p。 我們做如下推…

基于FPGA的SPI控制FLASH讀寫

基于FPGA的SPI控制FLASH讀寫 文章目錄基于FPGA的SPI控制FLASH讀寫一、SPI簡介二、FLASH_M25P16簡介信號描述功能操作注意時序三、設計思路框圖設計狀態機設計四、上板驗證1、讀ID2、讀數據3、扇區擦除寫數據五、總結六、代碼一、SPI簡介 SPI是Serial Peripheral interface的縮…

Pytest 參數化進階:掌握 parametrize 的多種用法

概述 在自動化測試中,@pytest.mark.parametrize 不僅僅能用來為測試函數提供多組輸入數據,還能配合其他功能實現更復雜的測試邏輯。本文將帶你深入了解 @pytest.mark.parametrize 的多種常見用法,助你在不同場景下寫出更高效、更清晰的測試代碼 基礎用法回顧:單個參數化 …

K8S 九 安全認證 TLS

目錄第九章 安全認證訪問控制概述認證管理授權管理 RBACRBACRolerules中的參數RoleBinding9.4 準入控制其他K8S的TLS是什么(DeepSeek)1. 加密通信2. 身份認證(Authentication)3. 數據完整性K8s 中 TLS 的具體應用**1. API Server …

積分兌換小程序Java

某個學校為了激勵學生踴躍參加一些社會實踐活動,會對參與者給予一些校園積分,學生們獲得校園積分后可以使用校園積分在指定的老師那兌換一些學習用具,當前可兌換的物品和對應的積分數量如下:鉛筆1分橡皮2分作業本3分文具盒5分為了…

函數指針示例

使用函數指針來調用 printf。下面是對代碼的詳細解釋&#xff1a;&#x1f4c4; 源代碼解析#include <stdio.h>int main() {int (*myshow)(const char *, ...); // 聲明一個函數指針&#xff0c;指向可變參數函數printf("hello world!\n");myshow printf; /…

不坑盒子突然不見了怎么辦?

如果你安裝后之前一切正常&#xff0c;突然某天在Office的功能區看不到不坑盒子了&#xff0c;這種是插件被禁用了&#xff0c;重裝安裝插件、Office都是不能解決的&#xff0c;必須按下面的方法解決。WPS中1.隨便打開一個文檔&#xff0c;點擊文件-選項-信任中心&#xff0c;最…

Java面試全棧通關:從微服務到AI的技術深度解析

Java面試全棧通關&#xff1a;從微服務到AI的技術深度解析 面試現場&#xff1a;大廠技術終面室 面試官&#xff1a;謝飛機同學&#xff0c;今天我們將從基礎到架構&#xff0c;全面考察你的Java技術棧掌握程度。請真實展示你的技術水平。 謝飛機&#xff1a;&#xff08;挺胸抬…

《Java 程序設計》第 7 章 - 繼承與多態

引言在 Java 面向對象編程中&#xff0c;繼承與多態是兩大核心特性&#xff0c;它們共同支撐了代碼的復用性、擴展性和靈活性。本章將從繼承的基本實現開始&#xff0c;逐步深入到方法覆蓋、訪問控制、抽象類等概念&#xff0c;最終揭示多態的本質與應用。通過大量可運行的代碼…

ksql連接數據庫免輸入密碼交互

ksql連接數據庫免輸入密碼交互1. 使用 .pgpass 文件&#xff08;推薦&#xff09;2. 使用環境變量3. 使用連接字符串4. 修改 ksql 的別名&#xff08;簡化命令&#xff09;5. 注意事項6. 密碼含特殊字符轉義在 Kingbase 中使用 ksql 連接數據庫時&#xff0c;如果希望避免每次手…

UniApp H5 適配 PC 端新姿勢:打造跨設備一致體驗

在移動互聯網蓬勃發展的今天&#xff0c;很多開發者會選擇使用 UniApp 來開發多端應用&#xff0c;尤其是 H5 端&#xff0c;因其無需下載安裝即可訪問的特性&#xff0c;深受用戶喜愛。但 UniApp H5 應用在 PC 端直接打開時&#xff0c;往往會因為屏幕尺寸的巨大差異&#xff…

【MySQL#4】函數 復合查詢 內外連接

&#x1f4c3;個人主頁&#xff1a;island1314 ?? 歡迎關注&#xff1a;&#x1f44d;點贊 &#x1f442;&#x1f3fd;留言 &#x1f60d;收藏 &#x1f49e; &#x1f49e; &#x1f49e; 生活總是不會一帆風順&#xff0c;前進的道路也不會永遠一馬平川&#xff0c;如何面…

C++常見面試題之一

一、語言基礎與內存管理const與constexpr的區別&#xff1f;應用場景&#xff1f; const&#xff1a;運行時常量&#xff0c;修飾變量/函數不可修改。constexpr&#xff1a;編譯期常量&#xff08;C11&#xff09;&#xff0c;用于優化計算&#xff08;如數組大小&#xff09;。…

Golang 語言中的指針介紹

介紹&#xff1a;指針式一種數據類型&#xff0c;用來存儲值的內存地址&#xff0c;為了便于理解&#xff0c;我們也可以把指針未內存地址&#xff0c;指針類型只占用內存4個或 8 個字節&#xff0c;在Golang 語言中&#xff0c;類型名稱加 * 表示改類型的指針類型。指針類型變…

Flink 狀態管理設計詳解:StateBackend、State、RocksDB和Namespace

為什么需要 StateBackend&#xff1f;—— 職責分離原則我們可以用一個銀行的例子來類比&#xff1a;State (如 ValueState, ListState) 就像是你的銀行卡。AbstractKeyedStateBackend 就像是銀行的整個后臺系統&#xff08;包括總服務器、數據庫、風控系統、會計系統等&#x…

櫥柜鉸鏈的革命:炬森精密如何以創新科技重塑家居體驗

在現代化家居設計中&#xff0c;櫥柜不僅是存儲空間的核心&#xff0c;更是生活品質的象征。而作為櫥柜的“關節”&#xff0c;櫥柜鉸鏈的性能直接影響著日常使用的便捷性、安全性和耐久性。然而&#xff0c;許多消費者在櫥柜使用中常遭遇噪音干擾、頻繁松動或早期損壞等痛點&a…

醫療系統國產化實錄:SQL Server國產替代,乙方保命指南

醫療行業的SQL Server替代&#xff0c;和普通業務系統完全不是一個量級——醫囑邏輯嵌套幾十層存儲過程、收費結算小數點錯位能引發醫患糾紛、電子病歷查詢慢一秒醫生直接拍桌子。作為被按在手術臺上的乙方PM&#xff0c;實測四款主流國產庫后&#xff0c;掏心窩子說句實話&…