六、聚類算法

一、聚類概念

1,通俗易懂而言,聚類主要運用于無監督學習中,也就是將沒有標簽的東西如何分為幾堆兒。
2,無監督學習即沒有標簽,不知道這些玩意到底是啥。當然,有監督學習就是由標簽,我們是提前知道這些玩意是啥。
3,聚類問題存在的問題難點:你咋知道這些玩意兒是一類?怕啥?你通過啥進行判斷分類的?也就是如何評估和如何調參問題。

二、K-MEANS算法

Ⅰ,基本概念

1,需要得到簇的個數,即需要指定K值。需要劃分多少類。
2,質心:均值,即向量各維取平均。例如五個點,其質心坐標為((x1+x2+x3+x4+x5)/5,(y1+y2+y3+y4+y5)/5)
3,距離的度量:常用歐幾里得距離和余弦相似度(先標準化)
4,優化目標:在這里插入圖片描述,求出每個點到哪個質心距離最近

Ⅱ,算法思路

①首先取得一些數據點
在這里插入圖片描述
②假設K設置成2,隨便找取兩個初始化點
在這里插入圖片描述
③開始迭代所有的綠色點,看看離哪個質心(紅色還是藍色)最近,離誰近就跟誰一個簇
在這里插入圖片描述
④把所有紅色和藍色的點全部取出來,求取質心,重新獲取質心,更新質心參數
在這里插入圖片描述
⑤重新對所有的數據進行求取離哪個質心最近就跟哪個質心為同一簇
在這里插入圖片描述
⑥繼續將所有的紅色和藍色點再次分別求取質心,再對所有點進行遍歷,看離哪個質心距離近就和哪個質心為同一簇
在這里插入圖片描述
⑦再次將所有的紅色和藍色點分別求取質心,再次遍歷所有點,找離哪個質心最近歸為一簇,直到所有的點歸屬簇不再發生變動為止

Ⅲ,優劣勢

優點:簡單、快速、適合一般情況下的常規數據集
缺點:K值不容易確定、復雜度和樣本呈線性關系、很難發現任意形狀的簇
在這里插入圖片描述

Ⅳ,K-Means可視化展示

K-Means可視化展示網站

三、DBSCAN算法

Ⅰ,基本概念

DBSCAN,Density-Based Spatial Clustering of Applications with Noise
畫圈--->找點--->發展下線開始洗腦

1,核心對象:若某個點的密度達到算法設定的閾值則其為核心點。即 r 鄰域內點的數量不小于 minPts
2,?-鄰域的距離閾值:設定的半徑r
3,直接密度可達:若某點p在點q的 r 鄰域內,且q是核心點則p-q直接密度可達。
4,密度可達:若有一個點的序列q0、q1、…qk,對任意q(i)—q(i-1)是直接密度可達的 ,則稱從q0到qk密度可達,這實際上是直接密度可達的“傳播”。
5,密度相連:若從某核心點p出發,點q和點k都是密度可達的 ,則稱點q和點k是密度相連的。
6,邊界點:屬于某一個類的非核心點,不能發展下線了
7,噪聲點:不屬于任何一個類簇的點,從任何一個核心點出發都是密度不可達的

在這里插入圖片描述
A:核心對象、B,C:邊界點、N:離群點

Ⅱ,算法思路

①輸入參數D,即你的數據集
輸入參數?,即指定半徑
輸入參數MinPts,密度閾值,也就是畫出來的圈內最少得有這么多點才行
在這里插入圖片描述
②參數選擇
1,半徑?,可以根據K距離來設定:找突變點K距離:給定數據集P={p(i); i=0,1,…n},計算點P(i)到集合D的子集S中所有點之間的距離,距離按照從小到大的順序排序,d(k)就被稱為k-距離。
2,MinPts: k-距離中k的值,一般取的小一些,多次嘗試

Ⅲ,優劣勢

優勢:不需要指定簇個數、可以發現任意形狀的簇、擅長找到離群點(檢測任務)、兩個參數就夠了
劣勢:高維數據有些困難(可以做降維)、參數難以選擇(參數對結果的影響非常大)、Sklearn中效率很慢(數據削減策略)

Ⅳ,DBSCAN可視化展示

DBSCAN可視化展示網站

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/377902.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/377902.shtml
英文地址,請注明出處:http://en.pswp.cn/news/377902.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Apache服務器通過.htaccess文件設置防盜鏈

用戶經常面對的一個問題就是服務器的流量問題,而站點文件被盜鏈是其中最為主要的部分。所謂盜鏈,是指其他網站直接鏈接我們網站上的文件,一般來 說,盜鏈的對象大多為很耗帶寬的大體積文件,如圖片、視頻等。這樣造成的后…

【C++grammar】string類和array類

目錄1、C11的string類1、創建 string 對象2、追加字符串append函數3、為字符串賦值assign函數4、at, clear, erase, and empty函數5、比較字符串compare()6、獲取子串at() 、substr()函數7、搜索字符串find()8、插入和替換字符串insert() 、replace()9、字符串運算符10、string…

六、聚類算法實戰

所有代碼塊都是在Jupyter Notebook下進行調試運行,前后之間都相互關聯。 文中所有代碼塊所涉及到的函數里面的詳細參數均可通過scikit-learn官網API文檔進行查閱,這里我只寫下每行代碼所實現的功能,參數的調整讀者可以多進行試驗調試。多動手…

超圖軟件試用許可操作步驟_軟件中的操作步驟

超圖軟件試用許可操作步驟The software comprises of three things: Program code, Documentation, and the Operating Procedures. The Program code is the entire software code. The Documentation is produced while the development of the software itself for the time…

mysql 2013錯誤

參考資料: 自由呼吸的世界-mysql 2013錯誤解決 windows下mysql日志文件開啟 今天,莫名其妙的來了個mysql 2013錯誤,導致無法登陸mysql gui工具,而且dos也進不去,提示ping 127.0.0.1,百度google后: 這是在使…

【嵌入式系統】STM32配置FreeRTOS以及利用多線程完成流水燈、按鍵、蜂鳴器、數碼管工作

目錄1、利用STM32CubeMX配置FreeRTOS2、完成流水燈、按鍵、蜂鳴器數碼管工作1、在gpio.c和.h文件里面書寫并聲明按鍵掃描和led、數碼管子程序2、在freertos.c文件里面設置全局變量并且在各自任務中載入程序3、關于FreeRTOS的注意事項1、利用STM32CubeMX配置FreeRTOS 假設我們之…

學好Java開發的關鍵七步

在學習編程的過程中,我覺得不止要獲得課本的知識,更多的是通過學習技術知識提高解決問題的能力,這樣我們才能走在最前方,本文主要講述如何學好Java開發的關鍵七步,更多Java專業知識,廣州瘋狂Java培訓為你講…

css模糊_如何使用CSS模糊圖像?

css模糊Introduction: 介紹: Sometimes even the professional developers tend to forget the various basic properties which can be applied to solve very simple problems, therefore the fundamentals of developing a website or web page should be very …

七、決策樹算法和集成算法

一、決策樹算法 Ⅰ,樹模型 決策樹:從根節點開始一步步走到葉子節點(決策) 所有的數據最終都會落到葉子節點,既可以做分類也可以做回歸 對于分類:是由眾數決定的,例如爺爺奶奶媽媽都是負數&…

leetcode 538. 把二叉搜索樹轉換為累加樹 思考分析

題目 給出二叉 搜索 樹的根節點,該樹的節點值各不相同,請你將其轉換為累加樹(Greater Sum Tree),使每個節點 node 的新值等于原樹中大于或等于 node.val 的值之和。 提醒一下,二叉搜索樹滿足下列約束條件&…

SQL中GROUP BY語句與HAVING語句的使用

最近在學習SQL Server相關知識,一直不知道怎么使用GROUP BY語句,經過研究和練習,終于明白如何使用了,在此記錄一下同時添加了一個自己舉的小例子,通過寫這篇文章來加深下自己學習的效果,還能和大家分享下&a…

scala語言示例_var關鍵字與Scala中的示例

scala語言示例Scala var關鍵字 (Scala var keyword) The var Keyword in scala is used to declare variables. As Scala does not require explicit declaration of data type of the variable, var keyword is used. The variable declared using the var keyword as mutable…

八、決策樹算法實驗可視化展示

一、樹模型的可視化展示 官網下載安裝包 右擊管理員身份運行,直接下一步即可。 配置環境變量: 將安裝好的可視化軟件的bin文件夾路徑添加到系統環境變量Path下即可 打開cmd,輸入dot -version,出現相關信息即安裝成功 二、決策…

關于在頁面中針對不同版本的IE瀏覽器實現不同的JS或者CSS樣式

一般會用到<!--[if IE]>這里是正常的html代碼<![endif]--> 條件注釋只能在windows Internet Explorer(以下簡稱IE)下使用&#xff0c;因此我們可以通過條件注釋來為IE添加特別的指令。因為這只是IE瀏覽器支持的注釋。 1&#xff0c;條件注釋的基本結構和HTML的注釋…

機器學習筆記:PCA的簡單理解以及應用建議

用notability做的筆記&#xff0c;比較隨意&#xff0c;對于第五點的PCA錯誤使用需要特別強調。 目錄1、PCA與線性回歸2、PCA主成分數量選擇3、壓縮重現4、PCA應用建議5、PCA的錯誤使用1、PCA與線性回歸 2、PCA主成分數量選擇 3、壓縮重現 4、PCA應用建議 5、PCA的錯誤使用

關于asp.net中的錯誤提示“將截斷字符串或二進制數據。 語句已終止。”

好久沒有更新博客了&#xff0c;今天在寫asp.net網站的時候&#xff0c;出現了這個問題。錯誤提示“將截斷字符串或二進制數據。 語句已終止。”通過調試&#xff0c;發現在插入數據的時候&#xff0c;由于插入的數據的字符或者二進制數據的長度大于原來定義的類型的長度。及保…

c# 無法將類型隱式轉換_C#中的隱式類型數組

c# 無法將類型隱式轉換C&#xff03;隱式類型數組 (C# Implicitly Typed Arrays) Like implicitly typed variables, we can also declare an array without specifying its type such type of arrays are known as Implicitly typed arrays. 像隱式類型的變量一樣&#xff0c;…

一、信用卡卡號識別

一、思路分析 大體思路&#xff1a;首先拿到一張銀行卡&#xff0c;我們得有銀行卡號數字的0-9樣式的模板&#xff0c;然后再通過不同數字的輪廓的外接矩形來進行匹配&#xff0c;最終識別出銀行卡號所對應的數字。 銀行卡數字模板&#xff1a; 銀行卡信息&#xff1a; 拿到…

bootstrap網格系統_如何使用Bootstrap網格系統?

bootstrap網格系統In the last article, we learned how to create a simple page of Bootstrap? Now, we will learn what is "Grid System" in Bootstrap and how we can use or implement it in our bootstrap page? As you know bootstrap is a mobile-friendl…

有關WriteableBitmap和BitmapImage之間的相互轉換

對于WP7中圖形處理有關WriteableBitmap和BitmapImage之間的相互轉換&#xff0c;給大家幾個簡單實用的方法。一、WriteableBitmap轉為BitmapImage對象var bi new BitmapImage(); bi.SetSource(wb.ToImage().ToStream()); //其中wb是WriteableBitmap對象。 二、BitmapImage轉為…