MATLAB環境下基于隨機游走拉普拉斯算子的快速譜聚類方法

古人有云,物以類聚,在面臨信息爆炸問題的今天,對信息類別劃分的價值日益顯現,并逐步成為學者們的研究熱點。分類和聚類是數據挖掘的重要工具,是實現事物類別劃分的左右手,聚類又是分類一種特殊的方式。所謂聚類,淺顯的講就是將指定數據集中的個體(或對象)按照某種約定規則劃分成若干個類別(也稱簇、組),使得劃分在同一類中的個體間具有強的共性特征,而分在不同類中的個體間差異最大化。聚類作為一種無監督的機器學習過程,它是基于觀察的學習而不是基于實例的學習,所以事先無需確定分類的準則和先驗知識,所以和有監督的機器學習方法相比,聚類分析方法更具靈活性。通過聚類分析技術,可以在不受人的先驗知識的束縛和干擾的情況下完成對無標識的數據對象類別劃分,從而獲取數據集合中潛在信息。

隨著聚類算法研究的深入,聚類在自然科學和社會科學的各個領域都得到了廣泛的應用,例如,搜索引擎門戶網站使用聚類來實現信息的快速定位,提高搜索效率;金融機構通過聚類來挖掘客戶的資料信息,實現風險的最小化;生物學家通過對含有遺傳信息的基因聚類來發現種群間的異同等。

聚類經過近幾十年的發展,已經有上千種聚類算法被提出,在最近的十幾年的時間里,提出的具有代表性的聚類算法有譜聚類算法、粒子群算法和近鄰傳播算法等。在現有的眾多聚類方法中,K-means算法是使用最普遍最經典的聚類算法之一,算法實現簡單,執行效率高。然而,K-means算法是建立在凸球形的樣本空間上基于中心的聚類算法,其準則函數是基于梯度的,僅在緊湊的具有超球空間結構的樣本集上才能得到較好的聚類結果,當樣本集空間結構非凸時,算法就會陷入局部最優劃分的困境中。

譜聚類算法對數據的結構分布不做強的假設,在非凸結構的數據集上任然能夠得到較好的聚類結果,克服了以經典K-means算法為代表的的基于中心聚類算法的缺點。此外,譜聚類對誤差數據和噪聲的敏感性不強,具有較好的魯棒性。在許多實際應用問題中,譜聚類都能取得較好的聚類效果。在最近的十年里,譜聚類方法日益受到學者們的關注并取得了迅猛的發展,和現有的主要聚類方法相比,譜聚類方法的優點明顯:

(1)算法實現起來直觀、簡單、方便,算法的核心問題為權矩陣的特征值分解,是一個經典的代數運算;(2)聚類結果穩定,算法不存在局部最優解;(3)對數據集的空間結構形狀不做強的要求,可以產生高質量的聚類結果;(4)理論基礎堅實,可以從譜圖理論、矩陣擾動理論、圖上隨機游走理論等多個角度給出合理解釋。

基于此,提出一種基于隨機游走拉普拉斯算子的快速譜聚類方法,算法運行環境為MAYLAB R2018A,部分代碼如下:

% Fast Spectral Clustering based on RandomWalk Laplacian 
% Input:
%       - Z: the initial cross similarity matrix between data points and anchors
%       - c: the number of clusters
% Output:
%       - clustering: the cluster assignment for each point
% Requre:
% 		mySVD.m
% 		litekmeans.m
% Usage:
%       % X: d*n
%       [laKMM, laMM, AnchorGraph, Anchors, ~, ~, ~]= KMM(X', c, m,k) ;Dv=diag(1./sum(Z,1));
U = mySVD(Z+Z*Dv,c+1);
U(:,1) = [];
U=U./repmat(sqrt(sum(U.^2,2)),1,c);
clustering=litekmeans(U,c,'MaxIter',100,'Replicates',10);

出圖如下:

工學博士,擔任《Mechanical System and Signal Processing》審稿專家,擔任
《中國電機工程學報》優秀審稿專家,《控制與決策》,《系統工程與電子技術》,《電力系統保護與控制》,《宇航學報》等EI期刊審稿專家。

擅長領域:現代信號處理,機器學習,深度學習,數字孿生,時間序列分析,設備缺陷檢測、設備異常檢測、設備智能故障診斷與健康管理PHM等。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/711981.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/711981.shtml
英文地址,請注明出處:http://en.pswp.cn/news/711981.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CodeWhisperer安裝教導--一步到位!以及本人使用Whisperer的初體驗。

CodeWhisperer是亞馬遜出品的一款基于機器學習的通用代碼生成器,可實時提供代碼建議。類似 Cursor 和Github AWS CodeWhisperer 亞馬遜科技的CodeWhisperer是Amazon于2021年12月推出的一款代碼補全工具,與GitHub Copilot類似。主要的功能有:代碼補全注釋…

貓毛過敏養貓人士的必備養貓好物-寵物空氣凈化器品牌分享

許多貓奴在與貓相處一段時間后突然對貓毛過敏,這真是令人難受。一些人認為對貓咪過敏是因為它們在空氣中飄浮的毛發引起的,但實際上大部分人之所以過敏是因為對貓身上一種微小的蛋白質過敏。這種導致過敏的蛋白質附著在貓咪的一些皮屑上。我們都知道貓咪…

前端架構: 腳手架通用框架封裝之入口文件開發(教程一)

腳手架入口文件開發 創建腳手架項目: abc-cli $ mkdir abc-cli && cd abc-cli 全局安裝 lerna, $ npm i -g lerna 基于 lerna 完成項目初始化 $ lerna init 基于 lerna 創建腳手架 cli $ lerna create cli一路回車 好現在生成了一個 cli 的模板,目前需要…

Qt 中Json的構造和解析簡單例子

概述: Qt中使用Json比較方便,不像純C需要導入CJson RapidJson JsonCpp等第三方的庫,主要使用到QJsonDocument、QJsonObject對象即可 1、如何構造一個json字符串 假如我們需要構造 {"cmd":"1001","data":{"content&q…

Linux 下安裝Jupyter

pip3 install jupyter pip3 install ipython -------------------------------------------- pip3 install jupyterlab jupyter lab pip3 list | grep jupyterlab 啟動: python3 -m jupyter lab 2.安裝朱皮特 pip3 install -i https://pypi.douban.com/simpl…

高性能的key-value數據庫Redis 介紹

Redis 是一個高性能的key-value數據庫。 Redis是一個開源的鍵值存儲系統,通常用于緩存和消息傳遞。它支持多種類型的數據結構,如字符串、列表、集合、散列表和有序集合等。Redis的特點是提供了高性能、靈活性和可伸縮性。 Redis的主要特點包括&#xff…

Pytorch學習 day02(加載數據)

加載數據 * Dataset提供一種方式:來獲取數據及其label,給數據進行編號 * Dataloader為神經網絡提供不同的數據形式 Dataset的組織形式有很多種,例如: 將label放在文件夾名上,如下: #Dateset # --train #…

Python算法題集_組合總和

Python算法題集_組合總和 題39:組合總和1. 示例說明2. 題目解析- 題意分解- 優化思路- 測量工具 3. 代碼展開1) 標準求解【值傳遞回溯】2) 改進版一【引用傳遞堆棧回溯】3) 改進版二【過程值列表緩存遍歷后檢索】 4. 最優算法5. 相關資源 本文為Python算法題集之一的…

.halo勒索病毒的最新威脅:如何恢復您的數據?

尊敬的讀者: 隨著科技的發展,網絡安全已經成為我們日常生活中不可忽視的重要議題。其中,勒索病毒是當前網絡安全威脅中的一大挑戰,而“.halo”勒索病毒更是近期備受關注的惡意軟件之一。本文將介紹關于“.halo”勒索病毒的背景知…

AI新工具(20240227) StickerBaker文本生成貼紙的工具;Mistral Large;Rewind等

StickerBaker - 基于Replicate和Fly.io技術,100%開源的制作貼紙的工具 StickerBaker是一個基于人工智能的貼紙創作工具,允許用戶通過輸入特定的提示語句生成獨特的貼紙。這個工具使用了Replicate平臺來生成貼紙,同時依托于Fly.io作為其基礎設…

算法項目外包的收費方式

針對算法研究性項目的收費方式和注意事項,這取決于項目的具體性質、規模和所涉及的技術領域。以下是一些常見的收費方式和需要注意的問題,希望對大家有所幫助。北京木奇移動技術有限公司,專業的軟件外包開發公司,歡迎交流合作。 收…

Python學習DAY09_文件和異常

文件和異常 實際開發中常常會遇到對數據進行持久化操作的場景,而實現數據持久化最直接簡單的方式就是將數據保存到文件中。 在 Python 中實現文件的讀寫操作其實非常簡單,通過 Python 內置的 open 函數,我們可以指定文件名、操作模式、編碼信…

1552.平衡二叉樹

輸入格式 第一行包含整數 N,表示總插入值數量。第二行包含 N 個不同的整數,表示每個插入值。 輸出格式 輸出得到的 AVL 樹的根是多少。 數據范圍 1≤N≤20 輸入樣例1: 5 88 70 61 96 120 輸出樣例1: 70 輸入樣例2&#xff1a…

商業江湖大揭秘:月入千萬與顆粒無收,究竟差了什么?

在商業的浩瀚江湖 英雄豪杰們或乘風破浪、月入千萬,或步履蹣跚、顆粒無收,這背后的奧秘究竟何在?是天意難測,還是人為疏忽?是制度的不完善,還是工具的滯后不前?答案就隱藏在你未曾注意的細節之…

公司招嵌入式開發崗位,為什么感覺一年比一年難?

最近看到一個問題: 是一個HR在吐槽招不到嵌入式開發的人才。 這句話,難免會誤導一些想入行嵌入式的同學,臥槽,這么缺人?趕緊沖! 哼次哼次學完一堆技術棧,一投簡歷,一個面試機會都沒有。 這就是…

24路電磁鎖主板在智能存儲系統中的作用

在無人值守場景中,如自助服務機、智能生鮮柜、共享儲物柜等,使用24路電磁鎖主板可以集成身份識別技術,將用戶的驗證結果轉化為相應的開鎖動作,提升用戶體驗和運營效率,是實現智能存儲系統高效、安全和自動化運行的關鍵…

Kubernetes的五大開源存儲項目

在Kubernetes中,關于數據的持久化管理是一種挑戰,對此,社區提供了多種存儲的解決方案,這些方案旨在簡化和優化容器化應用程序的持久化數據管理。 現介紹 Kubernetes 的五大開源存儲項目,帶你了解開源存儲解決方案的多…

unity后期

unity|后處理篇 前言一、Post-Processing 1、 Post-Processing的使用2、Post-Processing后處理效果 抗鋸齒①、Ambient Occlusion 環境光遮蔽②、Auto Exposure 自動曝光③、Bloom 輝光/泛光④、Chromatic Aberration | 色差⑤、Color Grading 色調/顏色分級⑥、Depth Of Fiel…

銳捷網絡攜數據中心、以太全光等創新解決方案亮相2024MWC

在西班牙巴塞羅那舉行的2024年世界移動通信大會(MWC)上,銳捷網絡(下文簡稱“銳捷”)展示了將技術與應用充分融合的云數據中心、5G、光網絡等產品及解決方案,幫助更多行業組織建設更貼近業務、智能、簡單、高效、綠色低碳的網絡基礎設施,應對當下及未來的挑戰,共同連接更廣闊可能…

PHP語言常見面試題:請解釋一下PHP是什么,以及它的主要用途是什么?

PHP,英文全稱為Hypertext Preprocessor,中文名稱為“超文本預處理器”。它是一種通用的開源腳本語言,特別適用于Web開發領域。PHP最初是由Rasmus Lerdorf在1995年創建的,并且自那時以來,它已經發展成為一個功能強大且易…