????????大家好!今天我們來深入學習《算法導論》第 14 章 —— 數據結構的擴張。這一章主要介紹了如何基于現有數據結構(如二叉搜索樹)擴展出新的功能,以滿足更復雜的問題需求。我們會從動態順序統計樹講到區間樹,每個知識點都會配上完整可運行的 C++ 代碼,方便大家動手實踐。
思維導圖
14.1 動態順序統計
????????在很多場景中,我們不僅需要像普通 BST 那樣查找元素,還需要知道元素在集合中的排名(秩),或者查找集合中第 i 小的元素。動態順序統計樹就是為了解決這類問題而設計的。
基本概念
- 秩(Rank):一個元素的秩是指該元素在集合的線性序中所處的位置(從 1 開始計數)
- 第 i 個順序統計量:集合中第 i 小的元素
數據結構設計
????????動態順序統計樹在普通 BST 的基礎上,為每個節點增加了一個size
屬性,表示以該節點為根的子樹中包含的節點總數(包括自身)。
// 動態順序統計樹節點結構
struct Node {int key; // 節點關鍵字int size; // 以該節點為根的子樹大小Node *left; // 左孩子Node *right; // 右孩子Node *parent; // 父節點// 構造函數Node(int k) : key(k), size(1), left(nullptr), right(nullptr), parent(nullptr) {}
};
核心操作實現
更新節點大小
當樹的結構發生變化(插入或刪除節點)時,需要更新相關節點的size
屬性:
// 更新節點的size(等于左子樹size + 右子樹size + 1)
void updateSize(Node *node) {if (node != nullptr) {node->size = 1; // 自身if (node->left != nullptr) {node->size += node->left->size;}if (node->right != nullptr) {node->size += node->right->size;}}
}
查找第 i 個元素
// 查找以node為根的子樹中第i個最小元素(1-based)
Node* select(Node *node, int i) {if (node == nullptr) return nullptr; // 空樹或i超出范圍// 左子樹的節點數int leftSize = (node->left != nullptr) ? node->left->size : 0;if (i == leftSize + 1) {// 當前節點就是第i個元素return node;} else if (i <= leftSize) {// 第i個元素在左子樹中return select(node->left, i);} else {// 第i個元素在右子樹中,注意要調整i的值return select(node->right, i - (leftSize + 1));}
}
計算元素的秩
// 計算x在以root為根的樹中的秩
int rank(Node *root, Node *x) {// x的左子樹大小 + 1(自身)int r = (x->left != nullptr) ? x->left->size + 1 : 1;Node *y = x;// 向上追溯到根節點while (y != root) {if (y == y->parent->right) {// 如果y是其父節點的右孩子,則需要加上父節點左子樹大小 + 1(父節點自身)r += (y->parent->left != nullptr) ? y->parent->left->size + 1 : 1;}y = y->parent;}return r;
}
插入操作
插入操作在普通 BST 插入的基礎上,需要從新插入的節點向上更新所有祖先的size
屬性:
// 向以root為根的樹中插入關鍵字key,返回新的根節點
Node* insert(Node *root, int key) {// 普通BST插入邏輯Node *parent = nullptr;Node **current = &root;while (*current != nullptr) {parent = *current;(*current)->size++; // 沿途節點size加1if (key < (*current)->key) {current = &((*current)->left);} else {current = &((*current)->right);}}*current = new Node(key);(*current)->parent = parent;return root; // 返回新的根節點
}
刪除操作
????????刪除操作相對復雜,需要先找到要刪除的節點,執行刪除(考慮三種情況:葉子節點、只有一個孩子、有兩個孩子),然后更新相關節點的size
屬性:
// 查找關鍵字為key的節點
Node* find(Node *root, int key) {Node *current = root;while (current != nullptr && current->key != key) {if (key < current->key) {current = current->left;} else {current = current->right;}}return current;
}// 找到以node為根的樹中的最小值節點
Node* minimum(Node *node) {while (node->left != nullptr) {node = node->left;}return node;
}// 替換子樹
void transplant(Node *&root, Node *u, Node *v) {if (u->parent == nullptr) {root = v; // u是根節點} else if (u == u->parent->left) {u->parent->left = v; // u是左孩子} else {u->parent->right = v; // u是右孩子}if (v != nullptr) {v->parent = u->parent; // 更新v的父節點}
}// 從樹中刪除節點z,返回新的根節點
Node* deleteNode(Node *root, Node *z) {if (z == nullptr) return root; // 節點不存在Node *y = nullptr;Node *x = nullptr;// 確定要刪除的實際節點yif (z->left == nullptr || z->right == nullptr) {y = z;} else {y = minimum(z->right); // 找到后繼節點}// 確定y的孩子xif (y->left != nullptr) {x = y->left;} else {x = y->right;}// 更新x的父節點if (x != nullptr) {x->parent = y->parent;}// 替換ytransplant(root, y, x);// 如果y不是z,則將y的內容復制到zif (y != z) {z->key = y->key;}// 更新受影響節點的sizeNode *p = y->parent;while (p != nullptr) {updateSize(p);p = p->parent;}delete y; // 釋放內存return root;
}
綜合案例:動態順序統計樹的應用
下面是一個完整的示例,展示了動態順序統計樹的各種操作:
#include <iostream>
#include <iomanip>
using namespace std;// 節點結構定義
struct Node {int key;int size;Node *left;Node *right;Node *parent;Node(int k) : key(k), size(1), left(nullptr), right(nullptr), parent(nullptr) {}
};// 輔助函數聲明
void updateSize(Node *node);
Node* select(Node *node, int i);
int getRank(Node *root, Node *x); // 重命名rank為getRank
Node* insert(Node *root, int key);
Node* find(Node *root, int key);
Node* minimum(Node *node);
void transplant(Node *&root, Node *u, Node *v);
Node* deleteNode(Node *root, Node *z);// 輔助函數實現
void updateSize(Node *node) {if (node != nullptr) {node->size = 1;if (node->left != nullptr) node->size += node->left->size;if (node->right != nullptr) node->size += node->right->size;}
}Node* select(Node *node, int i) {if (node == nullptr) return nullptr;int leftSize = (node->left != nullptr) ? node->left->size : 0;if (i == leftSize + 1) return node;else if (i <= leftSize) return select(node->left, i);else return select(node->right, i - (leftSize + 1));
}// 重命名rank為getRank,避免與標準庫沖突
int getRank(Node *root, Node *x) {int r = (x->left != nullptr) ? x->left->size + 1 : 1;Node *y = x;while (y != root) {if (y == y->parent->right) {r += (y->parent->left != nullptr) ? y->parent->left->size + 1 : 1;}y = y->parent;}return r;
}Node* insert(Node *root, int key) {Node *parent = nullptr;Node **current = &root;while (*current != nullptr) {parent = *current;(*current)->size++;if (key < (*current)->key) current = &((*current)->left);else current = &((*current)->right);}*current = new Node(key);(*current)->parent = parent;return root;
}Node* find(Node *root, int key) {Node *current = root;while (current != nullptr && current->key != key) {if (key < current->key) current = current->left;else current = current->right;}return current;
}Node* minimum(Node *node) {while (node->left != nullptr) node = node->left;return node;
}void transplant(Node *&root, Node *u, Node *v) {if (u->parent == nullptr) root = v;else if (u == u->parent->left) u->parent->left = v;else u->parent->right = v;if (v != nullptr) v->parent = u->parent;
}Node* deleteNode(Node *root, Node *z) {if (z == nullptr) return root;Node *y = nullptr, *x = nullptr;if (z->left == nullptr || z->right == nullptr) y = z;else y = minimum(z->right);if (y->left != nullptr) x = y->left;else x = y->right;if (x != nullptr) x->parent = y->parent;transplant(root, y, x);if (y != z) z->key = y->key;Node *p = y->parent;while (p != nullptr) {updateSize(p);p = p->parent;}delete y;return root;
}// 中序遍歷打印樹(用于調試)
void inorder(Node *node) {if (node != nullptr) {inorder(node->left);cout << node->key << "(" << node->size << ") ";inorder(node->right);}
}int main() {Node *root = nullptr;// 插入一些元素int keys[] = {15, 6, 18, 3, 7, 17, 20, 2, 4, 13, 9};for (int key : keys) {root = insert(root, key);}cout << "樹的中序遍歷(帶size): ";inorder(root);cout << endl << endl;// 測試select操作for (int i = 1; i <= 11; i++) {Node *node = select(root, i);if (node != nullptr) {cout << "第" << i << "小的元素是: " << node->key << endl;}}cout << endl;// 測試rank操作,使用重命名后的getRankint testKeys[] = {15, 7, 20, 2};for (int key : testKeys) {Node *node = find(root, key);if (node != nullptr) {cout << "元素" << key << "的秩是: " << getRank(root, node) << endl;}}cout << endl;// 測試刪除操作int delKey = 6;Node *delNode = find(root, delKey);if (delNode != nullptr) {cout << "刪除元素" << delKey << "后,樹的中序遍歷: ";root = deleteNode(root, delNode);inorder(root);cout << endl << endl;// 再次測試select和rank操作cout << "刪除后,第3小的元素是: " << select(root, 3)->key << endl;cout << "刪除后,元素7的秩是: " << getRank(root, find(root, 7)) << endl;}return 0;
}
運行結果:
14.2 如何擴張數據結構
????????擴張數據結構是指在現有數據結構的基礎上添加新的信息和操作,以解決特定問題。以下是擴張數據結構的一般步驟:
選擇基礎數據結構:通常選擇能高效支持基本操作的數據結構(如 BST、紅黑樹等)
確定要添加的信息:根據問題需求,確定需要在原有結構上添加哪些額外信息
驗證新信息可以被維護:確保在基礎數據結構的所有操作(插入、刪除等)執行后,新添加的信息仍能被正確維護
實現新的操作:基于添加的信息,實現解決問題所需的新操作
設計原則
- 局部性:新信息應能通過節點本身及其子節點的信息計算得出
- 高效性:維護新信息的額外時間不應顯著增加原有操作的時間復雜度
- 必要性:只添加解決問題所必需的信息,避免冗余
動態順序統計樹就是一個典型的擴張例子:
- 基礎數據結構:二叉搜索樹(BST)
- 添加的信息:每個節點的
size
屬性 - 維護方式:插入 / 刪除時更新路徑上所有節點的
size
- 新操作:
select
和rank
14.3 區間樹
區間樹是一種支持區間查詢的數據結構,它能高效地找出與給定區間重疊的所有區間。
區間表示與問題定義
- 區間通常表示為
[low, high]
,其中low
是區間的起點,high
是區間的終點 - 兩個區間
[a,b]
和[c,d]
重疊當且僅當a ≤ d
且c ≤ b
- 區間樹的主要操作:插入區間、刪除區間、查詢所有與給定區間重疊的區間
數據結構設計
區間樹基于 BST 擴展而來,每個節點存儲:
- 一個區間
[low, high]
- 以區間的
low
為關鍵字構建 BST - 額外添加
max
屬性,表示以該節點為根的子樹中所有區間的high
的最大值
// 區間結構
struct Interval {int low; // 區間起點int high; // 區間終點Interval(int l, int h) : low(l), high(h) {}
};// 區間樹節點結構
struct IntervalNode {Interval *interval; // 區間int max; // 子樹中最大的high值IntervalNode *left; // 左孩子IntervalNode *right; // 右孩子IntervalNode *parent;// 父節點// 構造函數IntervalNode(int low, int high) : interval(new Interval(low, high)), max(high), left(nullptr), right(nullptr), parent(nullptr) {}
};
區間樹的類圖:
@startuml
class Interval {- int low- int high+ Interval(int l, int h)
}class IntervalNode {- Interval* interval- int max- IntervalNode* left- IntervalNode* right- IntervalNode* parent+ IntervalNode(int low, int high)
}IntervalNode "1" *-- "1" Interval : contains
IntervalNode "1" --* "0..1" IntervalNode : left child
IntervalNode "1" --* "0..1" IntervalNode : right child
@enduml
核心操作實現
更新 max 值
// 更新節點的max值(自身high和左右子樹max中的最大值)
void updateMax(IntervalNode *node) {if (node != nullptr) {node->max = node->interval->high; // 自身區間的highif (node->left != nullptr && node->left->max > node->max) {node->max = node->left->max;}if (node->right != nullptr && node->right->max > node->max) {node->max = node->right->max;}}
}
插入操作
// 向區間樹中插入新區間
IntervalNode* insertInterval(IntervalNode *root, int low, int high) {// 普通BST插入(以low為關鍵字)IntervalNode *parent = nullptr;IntervalNode **current = &root;while (*current != nullptr) {parent = *current;// 更新當前節點的max值if (high > (*current)->max) {(*current)->max = high;}// 繼續查找插入位置if (low < (*current)->interval->low) {current = &((*current)->left);} else {current = &((*current)->right);}}// 創建新節點*current = new IntervalNode(low, high);(*current)->parent = parent;return root;
}
區間查詢操作
查詢所有與給定區間[low, high]
重疊的區間:
// 檢查兩個區間是否重疊
bool overlap(Interval *a, Interval *b) {return a->low <= b->high && b->low <= a->high;
}// 查詢與target重疊的所有區間
void queryOverlapping(IntervalNode *node, Interval *target, vector<Interval*>& result) {if (node == nullptr) return;// 先檢查左子樹if (node->left != nullptr && node->left->max >= target->low) {queryOverlapping(node->left, target, result);}// 檢查當前節點if (overlap(node->interval, target)) {result.push_back(node->interval);}// 再檢查右子樹if (node->right != nullptr && node->interval->low <= target->high) {queryOverlapping(node->right, target, result);}
}
查詢算法的流程圖:
刪除操作
刪除操作需要在刪除節點后更新相關節點的max
值:
// 查找最小值節點(最左節點)
IntervalNode* intervalMinimum(IntervalNode *node) {while (node->left != nullptr) {node = node->left;}return node;
}// 區間樹的替換操作
void intervalTransplant(IntervalNode *&root, IntervalNode *u, IntervalNode *v) {if (u->parent == nullptr) {root = v;} else if (u == u->parent->left) {u->parent->left = v;} else {u->parent->right = v;}if (v != nullptr) {v->parent = u->parent;}
}// 刪除區間節點
IntervalNode* deleteIntervalNode(IntervalNode *root, IntervalNode *z) {if (z == nullptr) return root;IntervalNode *y = nullptr;IntervalNode *x = nullptr;// 確定要刪除的節點yif (z->left == nullptr || z->right == nullptr) {y = z;} else {y = intervalMinimum(z->right);}// 確定y的孩子xif (y->left != nullptr) {x = y->left;} else {x = y->right;}// 更新x的父節點if (x != nullptr) {x->parent = y->parent;}// 替換yintervalTransplant(root, y, x);// 如果y不是z,則復制y的內容到zif (y != z) {// 保存z的區間指針以便后續釋放Interval *oldInterval = z->interval;// 復制y的內容到zz->interval = y->interval;z->max = y->max;// 釋放y的區間(因為已經轉移給z了)y->interval = nullptr;delete oldInterval;}// 更新受影響節點的max值IntervalNode *p = y->parent;while (p != nullptr) {updateMax(p);p = p->parent;}// 釋放y的內存if (y->interval != nullptr) {delete y->interval;}delete y;return root;
}// 查找包含特定區間的節點
IntervalNode* findIntervalNode(IntervalNode *root, int low, int high) {IntervalNode *current = root;while (current != nullptr) {if (current->interval->low == low && current->interval->high == high) {return current;} else if (low < current->interval->low) {current = current->left;} else {current = current->right;}}return nullptr;
}
綜合案例:區間樹的應用
下面是一個完整的區間樹應用示例:
#include <iostream>
#include <vector>
using namespace std;// 區間結構定義
struct Interval {int low;int high;Interval(int l, int h) : low(l), high(h) {}
};// 區間樹節點結構定義
struct IntervalNode {Interval *interval;int max;IntervalNode *left;IntervalNode *right;IntervalNode *parent;IntervalNode(int low, int high) : interval(new Interval(low, high)), max(high), left(nullptr), right(nullptr), parent(nullptr) {}
};// 輔助函數聲明
void updateMax(IntervalNode *node);
IntervalNode* insertInterval(IntervalNode *root, int low, int high);
bool overlap(Interval *a, Interval *b);
void queryOverlapping(IntervalNode *node, Interval *target, vector<Interval*>& result);
IntervalNode* intervalMinimum(IntervalNode *node);
void intervalTransplant(IntervalNode *&root, IntervalNode *u, IntervalNode *v);
IntervalNode* deleteIntervalNode(IntervalNode *root, IntervalNode *z);
IntervalNode* findIntervalNode(IntervalNode *root, int low, int high);// 輔助函數實現
void updateMax(IntervalNode *node) {if (node != nullptr) {node->max = node->interval->high;if (node->left != nullptr && node->left->max > node->max) {node->max = node->left->max;}if (node->right != nullptr && node->right->max > node->max) {node->max = node->right->max;}}
}IntervalNode* insertInterval(IntervalNode *root, int low, int high) {IntervalNode *parent = nullptr;IntervalNode **current = &root;while (*current != nullptr) {parent = *current;if (high > (*current)->max) {(*current)->max = high;}if (low < (*current)->interval->low) {current = &((*current)->left);} else {current = &((*current)->right);}}*current = new IntervalNode(low, high);(*current)->parent = parent;return root;
}bool overlap(Interval *a, Interval *b) {return a->low <= b->high && b->low <= a->high;
}void queryOverlapping(IntervalNode *node, Interval *target, vector<Interval*>& result) {if (node == nullptr) return;if (node->left != nullptr && node->left->max >= target->low) {queryOverlapping(node->left, target, result);}if (overlap(node->interval, target)) {result.push_back(node->interval);}if (node->right != nullptr && node->interval->low <= target->high) {queryOverlapping(node->right, target, result);}
}IntervalNode* intervalMinimum(IntervalNode *node) {while (node->left != nullptr) {node = node->left;}return node;
}void intervalTransplant(IntervalNode *&root, IntervalNode *u, IntervalNode *v) {if (u->parent == nullptr) {root = v;} else if (u == u->parent->left) {u->parent->left = v;} else {u->parent->right = v;}if (v != nullptr) {v->parent = u->parent;}
}IntervalNode* deleteIntervalNode(IntervalNode *root, IntervalNode *z) {if (z == nullptr) return root;IntervalNode *y = nullptr;IntervalNode *x = nullptr;if (z->left == nullptr || z->right == nullptr) {y = z;} else {y = intervalMinimum(z->right);}if (y->left != nullptr) {x = y->left;} else {x = y->right;}if (x != nullptr) {x->parent = y->parent;}intervalTransplant(root, y, x);if (y != z) {Interval *oldInterval = z->interval;z->interval = y->interval;z->max = y->max;y->interval = nullptr;delete oldInterval;}IntervalNode *p = y->parent;while (p != nullptr) {updateMax(p);p = p->parent;}if (y->interval != nullptr) {delete y->interval;}delete y;return root;
}IntervalNode* findIntervalNode(IntervalNode *root, int low, int high) {IntervalNode *current = root;while (current != nullptr) {if (current->interval->low == low && current->interval->high == high) {return current;} else if (low < current->interval->low) {current = current->left;} else {current = current->right;}}return nullptr;
}// 打印區間
void printInterval(Interval *interval) {cout << "[" << interval->low << ", " << interval->high << "]";
}int main() {IntervalNode *root = nullptr;// 插入一些區間root = insertInterval(root, 15, 20);root = insertInterval(root, 10, 30);root = insertInterval(root, 17, 19);root = insertInterval(root, 5, 20);root = insertInterval(root, 12, 15);root = insertInterval(root, 30, 40);// 查詢與[14, 16]重疊的區間Interval *target = new Interval(14, 16);vector<Interval*> result;queryOverlapping(root, target, result);cout << "與區間[14, 16]重疊的區間有:" << endl;for (Interval *interval : result) {printInterval(interval);cout << " ";}cout << endl << endl;// 刪除區間[10, 30]IntervalNode *nodeToDelete = findIntervalNode(root, 10, 30);if (nodeToDelete != nullptr) {root = deleteIntervalNode(root, nodeToDelete);cout << "刪除區間[10, 30]后,與[14, 16]重疊的區間有:" << endl;result.clear();queryOverlapping(root, target, result);for (Interval *interval : result) {printInterval(interval);cout << " ";}cout << endl;}// 釋放內存delete target;// 完整的內存釋放還需要遍歷樹刪除所有節點,這里簡化處理return 0;
}
運行結果:
思考題
如何在動態順序統計樹上實現范圍查詢(即查找所有關鍵字在 [a, b] 之間的元素),并計算該范圍內元素的個數?
試設計一種基于紅黑樹的區間樹,確保所有操作(插入、刪除、查詢)都能在 O (log n) 時間內完成。
如何擴展區間樹,使其能高效支持 “查找包含點 x 的所有區間” 這一操作?
設計一種數據結構,支持在 O (1) 時間內查找最小值,在 O (log n) 時間內插入和刪除元素,以及在 O (log n) 時間內查找第 i 小的元素。
本章注記
- 數據結構的擴張是解決復雜問題的重要技術,其核心在于找到合適的基礎結構和需要添加的信息
- 紅黑樹常被用作擴張的基礎結構,因為它能在 O (log n) 時間內支持插入、刪除等操作
- 除了本章介紹的動態順序統計樹和區間樹,還有許多其他重要的擴張數據結構,如:
- 線段樹:用于處理區間上的范圍查詢和更新
- 二叉索引樹(Fenwick 樹):高效支持前綴和查詢和點更新
- 平衡二叉搜索樹:如 AVL 樹、Splay 樹等,在 BST 基礎上添加了平衡條件
????????希望本章內容能幫助大家理解數據結構擴張的思想和方法。通過動手實現這些數據結構,相信大家能更深入地掌握其中的原理和技巧。如果有任何疑問或建議,歡迎在評論區留言討論!