【Algorithm】Union-Find簡單介紹

文章目錄

  • Union-Find
    • 1 基本概念
      • 1.1 `Find(x)` - 查詢操作
      • 1.2 `Union(x, y)` - 合并操作
    • 2 并查集的結構和優化
      • 2.1 數據結構設計
      • 2.2 兩大優化策略(關鍵)
        • 2.2.1 路徑壓縮(Path Compression)
        • 2.2.2 按秩合并(Union by Rank or Size)
    • 3 使用并查集的注意事項
    • 4 典型應用場景
      • 4.1 判斷連通性
      • 4.2 等價類/合并集合
      • 4.3 檢測環路(圖中是否有環)
      • 4.4 島嶼問題/連通區域
      • 4.5 網絡連接問題
    • 5 實現模板
    • 6 問題示例:合并等價字符集合(字典序最小)
    • 7 總結

Union-Find

1 基本概念

并查集是一種用于處理集合合并與查詢的數據結構,主要用于解決:

  • 判斷兩個元素是否屬于同一個集合
  • 合并兩個集合
  • 圖的連通性問題(如 Kruskal 最小生成樹、島嶼數量、等價類問題)

核心思想:每個元素初始是一個獨立的集合(自成一個樹的根)。使用兩個操作:

  1. find(x):查找元素 x 所在集合的代表元(根)
  2. union(x, y) / unite(x, y):將元素 x 和 y 所在的兩個集合合并為一個

1.1 Find(x) - 查詢操作

  • 找出元素 x 所在集合的代表元(也叫根節點、父節點)
  • 判斷兩個元素是否屬于同一個集合:只需比較它們的代表元是否相同

1.2 Union(x, y) - 合并操作

  • 將元素 xy 所在的兩個集合合并
  • 目的是把兩個集合的元素歸于同一個集合(也就是連通)

并查集的本質:將多個不相交的集合合并,并在查詢時保持高效


2 并查集的結構和優化

2.1 數據結構設計

  • parent[i]:表示第 i 個元素的父節點(初始時每個元素是自己的父親)

  • 常見擴展字段:

    • rank[i]:節點的秩(可以理解為樹的高度或大小,用于優化合并)
    • size[i]:集合的大小(如果你需要追蹤每個集合的元素個數)

2.2 兩大優化策略(關鍵)

2.2.1 路徑壓縮(Path Compression)
  • 優化 find(x) 操作
  • 將 x 到根節點路徑上的所有節點直接指向根,降低后續查找的復雜度
  • 時間復雜度近似 O(α(n)),α 是反阿克曼函數,幾乎是常數
int find(int x) {if (parent[x] != x)parent[x] = find(parent[x]);return parent[x];
}
  • 每次查詢時,將 x 的所有祖先直接掛到根節點,形成扁平結構
  • 減少下次查找路徑長度
2.2.2 按秩合并(Union by Rank or Size)
  • 合并時,總是將“較矮”的樹合并到“較高”的樹,保持整體平衡,防止鏈式退化
void union(int x, int y) {int px = find(x), py = find(y);if (px == py) return;if (rank[px] < rank[py])parent[px] = py;else if (rank[px] > rank[py])parent[py] = px;else {parent[py] = px;rank[px]++;}
}

3 使用并查集的注意事項

注意事項說明
初始化每個元素一開始是自己的父節點(parent[i] = i
找代表元要用 find()不要直接比較 parent[x] == parent[y],必須比較 find(x) == find(y)
使用路徑壓縮提高查找效率,避免變成鏈表結構
合并要檢查代表元避免重復合并或死循環
不適合有環結構查詢并查集不能表示通用圖(除非用于檢測是否成環)
不支持高頻動態插入刪除并查集適合處理固定集合或批量問題,不適合頻繁插入刪除

4 典型應用場景

并查集廣泛應用于以下場景:

4.1 判斷連通性

  • 無向圖中判斷兩個點是否連通
  • 例題:LeetCode 547. 省份數量(朋友圈)

4.2 等價類/合并集合

  • 把多個元素按關系合并為“集合組”
  • 例題:LeetCode 1061. 按字典序排列的最小等價字符串

4.3 檢測環路(圖中是否有環)

  • 并查集用于無向圖的成環檢測
  • 例題:Kruskal 最小生成樹(MST)

4.4 島嶼問題/連通區域

  • 將二維網格中相鄰的“陸地”用并查集合并,統計島嶼數
  • 例題:LeetCode 200. 島嶼數量

4.5 網絡連接問題

  • 網絡中節點是否連通、連接多少次才能連通
  • 例題:LeetCode 1319. 連通網絡的操作次數

5 實現模板

class UnionFind {
private:vector<int> parent;vector<int> rank;  // 或者 sizepublic:UnionFind(int n) {parent.resize(n);rank.resize(n, 1);iota(parent.begin(), parent.end(), 0); // parent[i] = i}// 查找根節點,并進行路徑壓縮int find(int x) {if (parent[x] != x)parent[x] = find(parent[x]); // 路徑壓縮return parent[x];}// 合并兩個集合void unite(int x, int y) {int px = find(x);int py = find(y);if (px == py) return;// 按秩合并if (rank[px] < rank[py]) {parent[px] = py;} else if (rank[px] > rank[py]) {parent[py] = px;} else {parent[py] = px;rank[px]++;}}// 判斷兩個元素是否在同一個集合bool connected(int x, int y) {return find(x) == find(y);}
};

6 問題示例:合并等價字符集合(字典序最小)

當我們想用并查集維護字符集合時,可以做如下改造:

  • parent[26]:表示字符 ‘a’ 到 ‘z’ 的父節點
  • 合并時總是把字典序較小的字符作為根,這樣找出的代表字符就是該等價類的最小字母
class Solution {
public:string smallestEquivalentString(string s1, string s2, string baseStr) {vector<int> parent(26);iota(parent.begin(), parent.end(), 0); // a-z 的并查集// 路徑壓縮查找function<int(int)> find = [&](int x) {if (parent[x] != x)parent[x] = find(parent[x]);return parent[x];};// 合并兩個字符等價類,保留字典序較小的作為代表auto unite = [&](int x, int y) {int px = find(x);int py = find(y);if (px == py) return;if (px < py)parent[py] = px;elseparent[px] = py;};for (int i = 0; i < s1.length(); ++i) {unite(s1[i] - 'a', s2[i] - 'a');}string res;for (char c : baseStr) {res += (char)(find(c - 'a') + 'a');}return res;}
};

7 總結

問題特征是否適合使用并查集
不相交集合合并非常適合(核心用途)
判斷兩個元素是否屬于同一集合非常高效
圖的連通性/聚類問題適合
頻繁增刪元素不適合,建議用更復雜的數據結構
要維護復雜屬性(如路徑)不適合
操作說明時間復雜度
find(x)查找 x 所在集合的代表元O(α(n))
unite(x,y)合并兩個集合O(α(n))
connected(x,y)判斷是否在同一集合O(α(n))

由于路徑壓縮和按秩合并優化,幾乎所有操作都是近乎常數時間。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84373.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84373.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84373.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LeetCode 高頻 SQL 50 題(基礎版)之 【高級字符串函數 / 正則表達式 / 子句】· 上

題目&#xff1a;1667. 修復表中的名字 題解&#xff1a; select user_id, concat(upper(left(name,1)),lower(right(name,length(name)-1))) name from Users order by user_id題目&#xff1a;1527. 患某種疾病的患者 題解&#xff1a; select * from Patients where con…

Linux系統的CentOS7發行版安裝MySQL80

文章目錄 前言Linux命令行內的”應用商店”安裝CentOS的安裝軟件的yum命令安裝MySQL1. 配置yum倉庫2. 使用yum安裝MySQL3. 安裝完成后&#xff0c;啟動MySQL并配置開機自啟動4. 檢查MySQL的運行狀態 MySQL的配置1. 獲取MySQL的初始密碼2. 登錄MySQL數據庫系統3. 修改root密碼4.…

Java + Spring Boot項目枚舉(Enum)目錄建議

在Java Spring Boot項目中&#xff0c;枚舉&#xff08;Enum&#xff09;的定義文件沒有固定的強制目錄&#xff0c;但通常遵循項目結構和最佳實踐來組織代碼。以下是常見的推薦位置&#xff1a; 1. 領域模型相關枚舉 目錄: domain/enums 或 model/enums 場景: 當枚舉與業務模…

Vue 模板語句的數據來源

&#x1f9e9; Vue 模板語句的數據來源&#xff1a;全方位解析 Vue 模板&#xff08;<template> 部分&#xff09;中的表達式、指令綁定&#xff08;如 v-bind, v-on&#xff09;和插值&#xff08;{{ }}&#xff09;都在一個特定的作用域內求值。這個作用域由當前 組件…

全新AI驅動Workspace Security 套件發布!Fortinet 電子郵件安全產品矩陣升級

專注推動網絡與安全融合的全球性綜合網絡安全解決方案供應商 Fortinet&#xff08;NASDAQ&#xff1a;FTNT&#xff09;&#xff0c;近日宣布發布新一代企業級郵件安全解決方案FortiMail Workspace Security 安全套件&#xff0c;全面增強旗下數據和生產力安全產品組合&#xf…

二十、【用戶管理與權限 - 篇二】前端交互:實現用戶管理界面

【用戶管理與權限 - 篇二】前端交互:實現用戶管理界面 前言準備工作第一部分:更新并確認前端 API 服務第二部分:添加用戶管理頁面的路由和側邊欄入口第三部分:實現用戶列表頁面第四部分:實現用戶編輯對話框組件第五部分:全面測試總結前言 在上一篇《【用戶管理與權限 - …

LeetCode --- 452周賽

題目列表 3566. 等積子集的劃分方案 3567. 子矩陣的最小絕對差 3568. 清理教室的最少移動 3569. 分割數組后不同質數的最大數目 一、等積子集的劃分方案 由于本題的數據范圍不大&#xff0c;我們可以暴力枚舉所有可能的劃分方式&#xff0c;代碼如下 // C class Solution { …

使用Python提取照片元數據:方法與實戰指南

## 引言&#xff1a;元數據的重要性 照片元數據&#xff08;Metadata&#xff09;是嵌入在圖像文件中的隱藏信息&#xff0c;記錄了拍攝設備、時間、地理位置、光圈快門參數等關鍵數據。這些信息廣泛應用于**數字取證**、**照片管理**、**地理標記分析**和**版權驗證**等場景。…

使用docker在3臺服務器上搭建基于redis 6.x的一主兩從三臺均是哨兵模式

一、環境及版本說明 如果服務器已經安裝了docker,則忽略此步驟,如果沒有安裝,則可以按照一下方式安裝: 1. 在線安裝(有互聯網環境): 請看我這篇文章 傳送陣>> 點我查看 2. 離線安裝(內網環境):請看我這篇文章 傳送陣>> 點我查看 說明&#xff1a;假設每臺服務器已…

阿里云ACP云計算備考筆記 (5)——彈性伸縮

目錄 第一章 概述 第二章 彈性伸縮簡介 1、彈性伸縮 2、垂直伸縮 3、優勢 4、應用場景 ① 無規律的業務量波動 ② 有規律的業務量波動 ③ 無明顯業務量波動 ④ 混合型業務 ⑤ 消息通知 ⑥ 生命周期掛鉤 ⑦ 自定義方式 ⑧ 滾的升級 5、使用限制 第三章 主要定義 …

CANopen轉Modbus TCP轉換器助生產線智能化升級

在自動化工業控制領域&#xff0c;CANopen和Modbus TCP是兩種廣泛采用的通信協議。它們各自具有獨特的特點和優勢&#xff0c;但在某些應用場景中&#xff0c;需要設備能夠同時支持這兩種通信標準。這就需要一個能夠實現開疆智能CANopen轉Modbus TCP轉換的網關KJ-TCPC-CANP設備…

C++圖書管理

圖書館的書籍分類系統使用二進制標簽管理&#xff0c;0 代表兒童讀物&#xff0c;1 代表青少年書籍。管理員發現當前的書架排列中不允許出現青少年書籍之后連接兒童讀物的情況&#xff08;即 10 子串&#xff09;。管理員每次可以交換任意兩本書的位置。請計算讓書架符合規定所…

汽車免拆診斷案例 | 2010款捷豹XFL車制動警告燈、DSC警告燈異常點亮

故障現象  一輛2010款捷豹XFL車&#xff0c;搭載3.0 L發動機&#xff0c;累計行駛里程約為35萬km。車主反映&#xff0c;該車組合儀表上的制動警告燈、動態穩定控制系統&#xff08;DSC&#xff09;警告燈異常點亮&#xff08;圖1&#xff09;&#xff0c;且提示“DSC NOT AV…

el-upload組件,上傳文件失敗,:on-error方法失效

el-upload組件方法失效 問題原因解決 問題 使用el-upload組件上傳文件&#xff0c;有這么一個問題上傳文件處理報錯Excel、Word。org.apache.poi.openxml4j.exceptions.OLE2NotOfficeXmlFileException。 按上述&#xff0c;后端編寫完代碼&#xff0c;輸出正常&#xff0c;但…

可視化圖解算法50:最小的K個數

牛客網 面試筆試 TOP101 | LeetCode 面試題 17.14. 最小K個數 1. 題目 描述 給定一個長度為 n 的可能有重復值的數組&#xff0c;找出其中不去重的最小的 k 個數。例如數組元素是4,5,1,6,2,7,3,8這8個數字&#xff0c;則最小的4個數字是1,2,3,4(任意順序皆可)。 數…

Ragflow配置注意項

在 .env文件中啟用v.0.19.0版本&#xff0c;帶emabedding models RAGFLOW_IMAGEinfiniflow/ragflow:v0.19.0 RAGFlow image tagImage size (GB)Has embedding models?Stable?v0.19.0≈9??Stable releasev0.19.0-slim≈2?Stable releasenightly≈9??Unstable nightly b…

Word VBA快速制作填空題

實例需求&#xff1a;Word文檔用于英語單詞學習&#xff0c;重點記憶單詞標記下劃線&#xff0c;其內容如下圖所示。 現在文檔轉換為填空題&#xff08;無論單詞字符多少&#xff0c;填空部分統一使用10個空格&#xff09;和參考答案兩部分&#xff0c;如下圖所示。 示例代碼如…

不變性(Immutability)模式

1. 不變性&#xff08;Immutability&#xff09;模式 1.1. 不變性模式的概念 定義&#xff1a;對象一旦被創建&#xff0c;其內部狀態就不再發生變化&#xff0c;也即“只讀無寫”&#xff0c;不會出現并發寫的問題&#xff0c;自然線程安全。 適用場景&#xff1a;只讀共享…

探秘鴻蒙 HarmonyOS NEXT:鴻蒙定時器,簡單倒計時的場景應用

在鴻蒙 ArkTS 開發中&#xff0c;定時器是實現動態效果和定時任務的重要工具。基于鴻蒙 API 12 及以上版本&#xff0c;ArkTS 提供了功能豐富的定時器 API&#xff0c;本文將帶你全面了解定時器的使用方法。 一、定時器常用 API 介紹 ArkTS 中的定時器主要分為一次性定時器&a…

安卓基礎(語義樹)

進化1 package com.example.demotest.unread;import android.accessibilityservice.AccessibilityService; import android.content.res.Resources; import android.graphics.Rect; import android.util.DisplayMetrics; import android.util.Log; import android.view.access…