MachineLearning(10)-聚類

news/2025/9/8 19:33:28/文章來源:https://blog.csdn.net/sinat_40624829/article/details/115975569

聚類

1.K-mean
2.系統聚類
3.DBSCAN聚類算法

聚類：無監督學習，將相似的樣本聚為一類。核心如何定義相似。
分類：有監督學習，依據分類準則，將樣本劃分為不同的類。核心分類器的設計（KNN）

聚類：根據彼此不同的屬性進行辨認，將具有相似屬性的事物聚為一類，使得同一類的事物具有高度的相似性。

1.K-mean

隨機選取k個類別中心
計算每個樣本點到每個中心的距離，將樣本歸類到距離最近的類中。
依據每個類的樣本更新類中心
重復2，3直至類中心變化小于某個閾值。

K-meas 算法的優點：簡介快速，時間復雜度O(nkt)
K-meas 算法的缺點：需要預先知道/設定聚類數量k

2.系統聚類

自底向上的一種方法：初始時，各個樣本自成一類，依據定義的相似度，每次合并一個類，不斷向上合并直至到達設定了類別數

定義樣本間距離和類間距離的計算方法，每個樣本自成一類
計算任意兩個類間距離，將距離最短的兩個類合并
重復步驟2直至聚為k類

樣本間距離：歐幾里得距離、均方距離、曼哈頓距離（1范數）、余弦距離、最大距離（無窮范數）
類間距離：最大距離、最小距離、平均距離、離差平方和距離

系統聚類的優點：靈活定義的距離對昂使得他有廣泛的適用性
系統聚類的缺點：時間復雜度高，一般為 $o(n^3)$ 。

3.DBSCAN聚類算法

DBSCAN：density-based spatial clustering of applications with noise
將類定義為：密度相連的點的最大集合，通過在樣本空間中不斷尋找最大集合從而完成聚類
有幾個基本定義： $?\epsilon$ 領域，核心對象，直接密度可達，密度可達，密度相連

密度可達是直接密度可達的傳遞閉包

定義半徑 $?\epsilon$ 和MinPts
抽取未被訪問的樣本點q
檢驗是否為核心對象，是-進入步驟4，否-返回步驟2
找出該樣本點所有密度可達的對象，構成聚類 $C_q$ .
重復步驟2，直至所有樣本點都被訪問過一遍

能在帶噪聲的樣本空間中發現任意形狀的聚類并排除噪聲

DBSCAN聚類的優點：能夠過濾低密度區域，發現稠密樣本點。不需要制定聚類數，可以過濾噪聲，時間復雜度 $o(nlog?n)o(n\log n)$

(概念稍微復雜點的一個聚類算法)

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/444745.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/444745.shtml
英文地址，請注明出處：http://en.pswp.cn/news/444745.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

幀同步和狀態同步（一）

幀同步和狀態同步（一）

幀同步什么是幀同步：幀同步常被RTS(即時戰略)游戲常采用。在游戲中同步的是玩家的操作指令，操作指令包含當前的幀索引。一般的流程是客戶端上傳操作到服務器， 服務器收到后并不計算游戲行為， 而是轉發到所有客戶端。這里最重要的…

閱讀更多...

幀同步和狀態同步（二）案例分析

幀同步和狀態同步（二）案例分析

轉自：http://www.gameres.com/489361.html 騰訊一下出了兩款MOBA游戲，全民超神，王者榮耀，玩了一下，效果不錯，就分析了一下它底層的一些技術，發現一個是采用的狀態同步，TCP協議&#…

閱讀更多...

leetcode279 完全平方數

leetcode279 完全平方數

給定正整數 n，找到若干個完全平方數（比如 1, 4, 9, 16, ...）使得它們的和等于 n。你需要讓組成和的完全平方數的個數最少。示例 1: 輸入: n 12 輸出: 3 解釋: 12 4 4 4. 示例 2: 輸入: n 13 輸出: 2 解釋: 13 4 9. 思路&#xf…

閱讀更多...

推薦系統(1)-概述

推薦系統(1)-概述

推薦系統概述1.數據部分2.模型部分2.1模型的組成2.2模型的訓練2.3模型評估《深度學習/推薦系統》讀書筆記推薦系統要處理的問題：對于用戶U(user)，在特定的場景C(context)，針對海量的“物品信息”，構建一個模型f(U,I,C)f(U,I,C)f(U…

閱讀更多...

（十七）深入淺出TCPIP之UDP打洞原理

（十七）深入淺出TCPIP之UDP打洞原理

專欄其他文章：理論篇：（一）深入淺出TCPIP之理解TCP報文格式和交互流程 (二）深入淺出TCPIP之再識TCP，理解TCP三次握手（上） (三）深入淺出TCPIP之再識TCP，理解TCP四次揮手（上） (四）深入淺出TCPIP之TCP三次握手和四次揮手（下）的抓包分析 (五）深入淺出TCPIP之TCP流…

閱讀更多...

leetcode240. 搜索二維矩陣 II

leetcode240. 搜索二維矩陣 II

編寫一個高效的算法來搜索 m x n 矩陣 matrix 中的一個目標值 target。該矩陣具有以下特性： 每行的元素從左到右升序排列。每列的元素從上到下升序排列。示例: 現有矩陣 matrix 如下： [ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6…

閱讀更多...

NAT原理

NAT原理

網絡地址轉換(NAT,Network Address Translation)屬接入廣域網(WAN)技術，是一種將私有（保留）地址轉化為合法IP地址的轉換技術。下面介紹兩類不同方式實現的NAT：NAT(Network Address Translators)：稱為基本的NAT在客戶機…

閱讀更多...

推薦系統(2)-協同過濾1-UserCF、ItemCF

推薦系統(2)-協同過濾1-UserCF、ItemCF

協同過濾1.CF概述2.數據表示3.衡量相似度4.共現矩陣5.UserCF6.ItemCF7.UserCF 與ItemCF 應用場景、主要缺陷8.基于UserCF 電影推薦demo《深度學習/推薦系統》讀書筆記推薦系統的發展一日千里傳統的推薦模型(2010年前后)：協同過濾、羅輯回歸、因子分解、梯度提升樹 …

閱讀更多...

sql查詢實例1（學生表_課程表_成績表_教師表）

sql查詢實例1（學生表_課程表_成績表_教師表）

表架構 Student(S#,Sname,Sage,Ssex) 學生表 Course(C#,Cname,T#) 課程表 SC(S#,C#,score) 成績表 Teacher(T#,Tname) 教師表建表語句 CREATE TABLE student ( s# INT, sname nvarchar(32), sage INT, ssex nvarchar(8) ) CREATE TABLE course ( c# INT, cname…

閱讀更多...

android 存儲方式以及路徑簡介

android 存儲方式以及路徑簡介

存儲分成了內部存儲和外部存儲。注意內部存儲又叫做機身內存，而且內存又包含了兩個部分RAM(運行時內存,這個和運行速度有關系，是手機運行時存儲數據和指令的地方)、ROM(這個才算是真正存儲東西的內部存儲范圍，是應用配置和其他數據的地方);而外部存儲就很明確了,用戶的外部掛…

閱讀更多...

MachineLearning(11)-關聯規則分析

MachineLearning(11)-關聯規則分析

關聯規則分析1.簡單來說-關聯規則2.經典關聯規則挖掘-Apriori1.簡單來說-關聯規則關聯規則–通過量化的數字描述物品甲的出現對物品乙的出現有多大影響。最早是為了發現超市銷售數據庫中不同的商品之間的關聯關系：哪組商品可能會在一次購物中同時購買。廣泛…

閱讀更多...

APK 安卓反編譯

APK 安卓反編譯

在學習Android開發的過程你，你往往會去借鑒別人的應用是怎么開發的，那些漂亮的動畫和精致的布局可能會讓你愛不釋手，作為一個開發者，你可能會很想知道這些效果界面是怎么去實現的，這時，你便可以對改應用的A…

閱讀更多...

sql查詢實例2（借書卡、圖書、借書記錄）

sql查詢實例2（借書卡、圖書、借書記錄）

問題描述： 本題用到下面三個關系表： CARD 借書卡。 CNO 卡號，NAME 姓名，CLASS 班級 BOOKS 圖書。 BNO 書號，BNAME 書名,AUTHOR 作者，PRICE 單價，QUANTITY 庫存冊數 BORROW 借書記錄。 CNO 借…

閱讀更多...

開始學習Unity3D（一）

開始學習Unity3D（一）

本人最近轉行開始做海外獨立游戲的發行，主要是負責服務器，開會注意到海外的服務越來越豐富越來越細分，對國內將會造成很大的沖擊，比如AWS，Google，GameSparks等，這導致國內的所謂服務器開發將越來越簡單，國內對服務器開發的需求越來越少，反而客戶端的需求越來越多，所以…

閱讀更多...

List 流的使用

List 流的使用

摘要本文將介紹在 Java 1.8 中對 List 進行流操作的使用方法。引入的 java.util.stream 包為開發者提供了一種更為便捷和強大的方式來處理集合數據。通過使用流，我們能夠以聲明性的方式進行集合操作，減少了樣板代碼，提高了代碼的可讀性和可…

閱讀更多...

推薦系統(3)-協同過濾2-矩陣分解算法

推薦系統(3)-協同過濾2-矩陣分解算法

協同過濾-矩陣分解算法1.奇異值分解2.梯度下降3.矩陣分解方法的優缺點《深度學習/推薦系統》讀書筆記（其實矩陣分解和協同過濾已經沒有特別大的聯系了） 2006年，在Netfilx舉辦的推薦算法競賽中Netflix Prize Challenge中，以矩陣分解…

閱讀更多...

leetcode141 環形鏈表

leetcode141 環形鏈表

給定一個鏈表，判斷鏈表中是否有環。為了表示給定鏈表中的環，我們使用整數 pos 來表示鏈表尾連接到鏈表中的位置（索引從 0 開始）。如果 pos 是 -1，則在該鏈表中沒有環。示例 1： 輸入：head …

閱讀更多...

iPhoneX適配

iPhoneX適配

目錄(?)[-]核心代碼自動化修改代碼參考資料iPhoneX適配，比較搓的一種方式，在不修改分辨率（720 x 1280）的情況下適配iphone X 主屏尺寸： 5.8英寸主屏分辨率： 2436 x 1125核心代碼修改工程目錄/Classes/Un…

閱讀更多...

centos安裝nginx，配置負載均衡

centos安裝nginx，配置負載均衡

1、安裝nginx安裝教程，參照：http://mp.weixin.qq.com/s/RVaRlRpHqZRjCaXGmOlfKw 2、反向代理的配置修改部署目錄下conf子目錄的nginx.conf文件的內容[html]view plaincopylocation / { #設置主機頭和客戶端真實地…

閱讀更多...

leetcode142 環形鏈表II

leetcode142 環形鏈表II

給定一個鏈表，返回鏈表開始入環的第一個節點。如果鏈表無環，則返回 null。為了表示給定鏈表中的環，我們使用整數 pos 來表示鏈表尾連接到鏈表中的位置（索引從 0 開始）。如果 pos 是 -1，則在該鏈表中沒有…

閱讀更多...

最新文章