python數據結構與算法-17_二叉查找樹

二叉查找樹(BST)

二叉樹的一種應用就是來實現堆,今天我們再看看用二叉查找樹(Binary Search Tree, BST)。
前面有章節說到了查找操作,包括線性查找、二分查找、哈希查找等,線性查找效率比較低,二分又要求必須是有序的序列,
為了維持有序插入的代價比較高、哈希查找效率很高但是浪費空間。能不能有一種插入和查找都比較快的數據結構呢?二叉查找樹就是這樣一種結構,可以高效地插入和查詢節點。

BST 定義

二叉查找樹是這樣一種二叉樹結構,它的每個節點包含一個 key 和它附帶的數據,對于每個內部節點 V:

  • 所有 key 小于 V 的都被存儲在 V 的左子樹
  • 所有 key 大于 V 的都存儲在 V 的右子樹

在這里插入圖片描述

注意這個限制條件,可別和堆搞混了。說白了就是對于每個內部節點,左子樹的 key 都比它小,右子樹都比它大。
如果中序遍歷(二叉樹遍歷講過了)這顆二叉樹,你會發現輸出的順序正好是有序的。
我們先來定義一下 BST 的節點結構:

class BSTNode(object):def __init__(self, key, value, left=None, right=None):self.key, self.value, self.left, self.right = key, value, left, right

構造一個 BST

我們還像之前構造二叉樹一樣,按照上圖構造一個 BST 用來演示:

class BST(object):def __init__(self, root=None):self.root = root@classmethoddef build_from(cls, node_list):cls.size = 0key_to_node_dict = {}for node_dict in node_list:key = node_dict['key']key_to_node_dict[key] = BSTNode(key, value=key)   # 這里值暫時用 和 key一樣的for node_dict in node_list:key = node_dict['key']node = key_to_node_dict[key]if node_dict['is_root']:root = nodenode.left = key_to_node_dict.get(node_dict['left'])node.right = key_to_node_dict.get(node_dict['right'])cls.size += 1return cls(root)NODE_LIST = [{'key': 60, 'left': 12, 'right': 90, 'is_root': True},{'key': 12, 'left': 4, 'right': 41, 'is_root': False},{'key': 4, 'left': 1, 'right': None, 'is_root': False},{'key': 1, 'left': None, 'right': None, 'is_root': False},{'key': 41, 'left': 29, 'right': None, 'is_root': False},{'key': 29, 'left': 23, 'right': 37, 'is_root': False},{'key': 23, 'left': None, 'right': None, 'is_root': False},{'key': 37, 'left': None, 'right': None, 'is_root': False},{'key': 90, 'left': 71, 'right': 100, 'is_root': False},{'key': 71, 'left': None, 'right': 84, 'is_root': False},{'key': 100, 'left': None, 'right': None, 'is_root': False},{'key': 84, 'left': None, 'right': None, 'is_root': False},
]
bst = BST.build_from(NODE_LIST)

BST 操作

查找

如何查找一個指定的節點呢,根據定義我們知道每個內部節點左子樹的 key 都比它小,右子樹的 key 都比它大,所以
對于帶查找的節點 search_key,從根節點開始,如果 search_key 大于當前 key,就去右子樹查找,否則去左子樹查找。 一直到當前節點是 None 了說明沒找到對應 key。

在這里插入圖片描述

好,擼代碼:

    def _bst_search(self, subtree, key):if subtree is None:   # 沒找到return Noneelif key < subtree.key:return self._bst_search(subtree.left, key)elif key > subtree.key:return self._bst_search(subtree.right, key)else:return subtreedef get(self, key, default=None):node = self._bst_search(self.root, key)if node is None:return defaultelse:return node.value

獲取最大和最小 key 的節點

其實還按照其定義,最小值就一直向著左子樹找,最大值一直向右子樹找,遞歸查找就行。

    def _bst_min_node(self, subtree):if subtree is None:return Noneelif subtree.left is None:   # 找到左子樹的頭return subtreeelse:return self._bst_min_node(subtree.left)def bst_min(self):node = self._bst_min_node(self.root)return node.value if node else None

插入

插入節點的時候我們需要一直保持 BST 的性質,每次插入一個節點,我們都通過遞歸比較把它放到正確的位置。
你會發現新節點總是被作為葉子結點插入。(請你思考這是為什么)
在這里插入圖片描述

    def _bst_insert(self, subtree, key, value):""" 插入并且返回根節點:param subtree::param key::param value:"""if subtree is None:   # 插入的節點一定是根節點,包括 root 為空的情況subtree = BSTNode(key, value)elif key < subtree.key:subtree.left = self._bst_insert(subtree.left, key, value)elif key > subtree.key:subtree.right = self._bst_insert(subtree.right, key, value)return subtreedef add(self, key, value):node = self._bst_search(self.root, key)if node is not None:   # 更新已經存在的 keynode.value = valuereturn Falseelse:self.root = self._bst_insert(self.root, key, value)self.size += 1return True

刪除節點

刪除操作相比上邊的操作要麻煩很多,首先需要定位一個節點,刪除節點后,我們需要始終保持 BST 的性質。
刪除一個節點涉及到三種情況:

  • 節點是葉節點
  • 節點有一個孩子
  • 節點有兩個孩子

我們分別來看看三種情況下如何刪除一個節點:

刪除葉節點

這是最簡單的一種情況,只需要把它的父親指向它的指針設置為 None 就好。

在這里插入圖片描述

刪除只有一個孩子的節點

刪除有一個孩子的節點時,我們拿掉需要刪除的節點,之后把它的父親指向它的孩子就行,因為根據 BST
左子樹都小于節點,右子樹都大于節點的特性,刪除它之后這個條件依舊滿足。

在這里插入圖片描述

刪除有兩個孩子的內部節點

假如我們想刪除 12 這個節點改怎么做呢?你的第一反應可能是按照下圖的方式:
在這里插入圖片描述

但是這種方式可能會影響樹的高度,降低查找的效率。這里我們用另一種非常巧妙的方式。
還記得上邊提到的嗎,如果你中序遍歷 BST 并且輸出每個節點的 key,你會發現就是一個有序的數組。
[1 4 12 23 29 37 41 60 71 84 90 100]。這里我們定義兩個概念,邏輯前任(predecessor)和后繼(successor),請看下圖:

在這里插入圖片描述

12 在中序遍歷中的邏輯前任和后繼分別是 4 和 23 節點。于是我們還有一種方法來刪除 12 這個節點:

  • 找到待刪除節點 N(12) 的后繼節點 S(23)
  • 復制節點 S 到節點 N
  • 從 N 的右子樹中刪除節點 S,并更新其刪除后繼節點后的右子樹

說白了就是找到后繼并且替換,這里之所以能保證這種方法是正確的,你會發現替換后依舊是保持了 BST 的性質。
有個問題是如何找到后繼節點呢?待刪除節點的右子樹的最小的節點不就是后繼嘛,上邊我們已經實現了找到最小 key 的方法了。

在這里插入圖片描述

我們開始編寫代碼實現,和之前的操作類似,我們還是通過輔助函數的形式來實現,這個遞歸函數會比較復雜,請你仔細理解:

    def _bst_remove(self, subtree, key):"""刪除節點并返回根節點"""if subtree is None:return Noneelif key < subtree.key:subtree.left = self._bst_remove(subtree.left, key)return subtreeelif key > subtree.key:subtree.right = self._bst_remove(subtree.right, key)return subtreeelse:  # 找到了需要刪除的節點if subtree.left is None and subtree.right is None:    # 葉節點,返回 None 把其父親指向它的指針置為 Nonereturn Noneelif subtree.left is None or subtree.right is None:  # 只有一個孩子if subtree.left is not None:return subtree.left   # 返回它的孩子并讓它的父親指過去else:return subtree.rightelse:  # 倆孩子,尋找后繼節點替換,并從待刪節點的右子樹中刪除后繼節點successor_node = self._bst_min_node(subtree.right)subtree.key, subtree.value = successor_node.key, successor_node.valuesubtree.right = self._bst_remove(subtree.right, successor_node.key)return subtreedef remove(self, key):assert key in selfself.size -= 1return self._bst_remove(self.root, key)

完整代碼你可以在本章的 bst.py 找到。
另外推薦一個可以在線演示過程的網址大家可以手動執行下看看效果: https://www.cs.usfca.edu/~galles/visualization/BST.html

時間復雜度分析

上邊介紹的操作時間復雜度和二叉樹的形狀有關。平均來說時間復雜度是和樹的高度成正比的,樹的高度 h 是 log(n),
但是最壞情況下以上操作的時間復雜度都是 O(n)。為了改善 BST 有很多變種,感興趣請參考延伸閱讀中的內容。

在這里插入圖片描述

源碼

# -*- coding: utf-8 -*-class BSTNode(object):def __init__(self, key, value, left=None, right=None):self.key, self.value, self.left, self.right = key, value, left, rightclass BST(object):def __init__(self, root=None):self.root = root@classmethoddef build_from(cls, node_list):cls.size = 0key_to_node_dict = {}for node_dict in node_list:key = node_dict['key']key_to_node_dict[key] = BSTNode(key, value=key)   # 這里值暫時用 和 key一樣的for node_dict in node_list:key = node_dict['key']node = key_to_node_dict[key]if node_dict['is_root']:root = nodenode.left = key_to_node_dict.get(node_dict['left'])node.right = key_to_node_dict.get(node_dict['right'])cls.size += 1return cls(root)def _bst_search(self, subtree, key):if subtree is None:   # 沒找到return Noneelif key < subtree.key:return self._bst_search(subtree.left, key)elif key > subtree.key:return self._bst_search(subtree.right, key)else:return subtreedef __contains__(self, key):"""實現 in 操作符"""return self._bst_search(self.root, key) is not Nonedef get(self, key, default=None):node = self._bst_search(self.root, key)if node is None:return defaultelse:return node.valuedef _bst_min_node(self, subtree):if subtree is None:return Noneelif subtree.left is None:   # 找到左子樹的頭return subtreeelse:return self._bst_min_node(subtree.left)def bst_min(self):node = self._bst_min_node(self.root)return node.value if node else Nonedef _bst_insert(self, subtree, key, value):""" 插入并且返回根節點:param subtree::param key::param value:"""if subtree is None:   # 插入的節點一定是根節點,包括 root 為空的情況subtree = BSTNode(key, value)elif key < subtree.key:subtree.left = self._bst_insert(subtree.left, key, value)elif key > subtree.key:subtree.right = self._bst_insert(subtree.right, key, value)return subtreedef add(self, key, value):node = self._bst_search(self.root, key)if node is not None:   # 更新已經存在的 keynode.value = valuereturn Falseelse:self.root = self._bst_insert(self.root, key, value)self.size += 1return Truedef _bst_remove(self, subtree, key):"""刪除節點并返回根節點"""if subtree is None:return Noneelif key < subtree.key:subtree.left = self._bst_remove(subtree.left, key)return subtreeelif key > subtree.key:subtree.right = self._bst_remove(subtree.right, key)return subtreeelse:  # 找到了需要刪除的節點if subtree.left is None and subtree.right is None:    # 葉節點,返回 None 把其父親指向它的指針置為 Nonereturn Noneelif subtree.left is None or subtree.right is None:  # 只有一個孩子if subtree.left is not None:return subtree.left   # 返回它的孩子并讓它的父親指過去else:return subtree.rightelse:  # 倆孩子,尋找后繼節點替換,并刪除其右子樹的后繼節點,同時更新其右子樹successor_node = self._bst_min_node(subtree.right)subtree.key, subtree.value = successor_node.key, successor_node.valuesubtree.right = self._bst_remove(subtree.right, successor_node.key)return subtreedef remove(self, key):assert key in selfself.size -= 1return self._bst_remove(self.root, key)NODE_LIST = [{'key': 60, 'left': 12, 'right': 90, 'is_root': True},{'key': 12, 'left': 4, 'right': 41, 'is_root': False},{'key': 4, 'left': 1, 'right': None, 'is_root': False},{'key': 1, 'left': None, 'right': None, 'is_root': False},{'key': 41, 'left': 29, 'right': None, 'is_root': False},{'key': 29, 'left': 23, 'right': 37, 'is_root': False},{'key': 23, 'left': None, 'right': None, 'is_root': False},{'key': 37, 'left': None, 'right': None, 'is_root': False},{'key': 90, 'left': 71, 'right': 100, 'is_root': False},{'key': 71, 'left': None, 'right': 84, 'is_root': False},{'key': 100, 'left': None, 'right': None, 'is_root': False},{'key': 84, 'left': None, 'right': None, 'is_root': False},
]def test_bst_tree():bst = BST.build_from(NODE_LIST)for node_dict in NODE_LIST:key = node_dict['key']assert bst.get(key) == keyassert bst.size == len(NODE_LIST)assert bst.get(-1) is None    # 單例的 None 我們用 is 來比較assert bst.bst_min() == 1bst.add(0, 0)assert bst.bst_min() == 0bst.remove(12)assert bst.get(12) is Nonebst.remove(1)assert bst.get(1) is Nonebst.remove(29)assert bst.get(29) is None

練習題:

  • 請你實現查找 BST 最大值的函數

延伸閱讀

  • 《Data Structures and Algorithms in Python》14 章,樹的概念和算法還有很多,我們這里介紹最基本的幫你打個基礎
  • 了解紅黑樹。普通二叉查找樹有個很大的問題就是難以保證樹的平衡,極端情況下某些節點可能會非常深,導致查找復雜度大幅退化。而平衡二叉樹就是為了解決這個問題。請搜索對應資料了解下。
  • 了解 mysql 索引使用的 B-Tree 結構(多路平衡查找樹),這個是后端面試數據庫的常考點。想想為什么?當元素非常多的時候,二叉樹的深度會很深,導致多次磁盤查找。從B樹、B+樹、B*樹談到R 樹

Leetcode

驗證是否是合法二叉搜索樹 [validate-binary-search-tree](https://leetcode.com/problems/validate-binary-search-tree/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/164050.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/164050.shtml
英文地址,請注明出處:http://en.pswp.cn/news/164050.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

亞馬遜賣家不想被平臺限制,應如何脫離平臺,建立自己的跨境獨立站?

隨著跨境電商的快速發展&#xff0c;越來越多的賣家選擇在亞馬遜等電商平臺上銷售自己的產品。然而&#xff0c;這些平臺往往會限制賣家的經營行為&#xff0c;收取高額的傭金和費用&#xff0c;給賣家帶來了很大的壓力和風險。因此&#xff0c;一些賣家開始考慮脫離電商平臺&a…

Flink之狀態TTL機制內容詳解

1 狀態TTL機制 狀態的 TTL機制就是Flink提供的自動化刪除狀態中的過期數據,配置 TTL的 API可以做到對狀態中的數據進行冷熱數據分離,將熱數據一直保存在狀態存儲器中,將冷數據進行定期刪除. 1.1 API簡介 TTL常用API如下: API注解setTtl(Time.seconds(…))配置過期時長,當狀態…

Docker可視化管理界面工具Portainer安裝

Portainer是Docker容器管理界面工具&#xff0c;可以直觀的管理Docker。 部署也很簡單&#xff1a; 官方安裝文檔地址 1、創建數據卷 docker volume create portainer_data2、下載允許容器 docker run -d -p 8000:8000 -p 9443:9443 --name portainer --restartalways -v /v…

放棄無謂的「技術氛圍」幻想,準備戰斗

大型科技公司每年都招聘大量研發人才&#xff0c;這給了很多人一種錯覺&#xff0c;認為是「技術」導致了這些公司的成功&#xff0c;其實他們的成功是技術推動的市場戰略的成功&#xff0c;是市場需要某項服務&#xff0c;才需要研發人員夜以繼日的埋頭苦干。資本絕不會做虧本…

vue2 element el-transfer穿梭框組件支持拖拽及排序 已封裝,隨取隨用

項目場景&#xff1a; 項目中有個功能用到穿梭框組件&#xff0c;新版本需要支持穿梭框組件排序&#xff0c;由于element2版本中的穿梭框組件本身不支持排序功能 在此不僅需要支持隨意更換順序&#xff0c;還支持從一側拖拽至另一側&#xff0c;具體功能效果圖如下&#xff1…

為什么JSX只能在函數的返回語句中使用

JSX只能在函數的返回語句中使用&#xff0c;因為JSX本質上是一種聲明式的語法&#xff0c;用于描述React組件的結構和外觀。在函數的返回語句中使用JSX&#xff0c;可以將JSX表達式嵌入到組件的輸出中。 當我們編寫一個React組件時&#xff0c;我們通常需要定義一個Render函數…

消息中間件——RabbitMQ(五)快速入門生產者與消費者,SpringBoot整合RabbitMQ!

前言 本章我們來一次快速入門RabbitMQ——生產者與消費者。需要構建一個生產端與消費端的模型。什么意思呢&#xff1f;我們的生產者發送一條消息&#xff0c;投遞到RabbitMQ集群也就是Broker。 我們的消費端進行監聽RabbitMQ&#xff0c;當發現隊列中有消息后&#xff0c;就進…

森利威爾SL4010 升壓恒壓 12V升壓24V 12V升壓36V 12V升壓48V

在當今的電子設備中&#xff0c;電源管理系統的設計是非常重要的。為了保證設備的穩定運行&#xff0c;升壓和恒壓電源的應用已經成為不可或缺的一部分。在這篇文章中&#xff0c;我們將介紹森利威爾SL4010升壓恒壓電源&#xff0c;它可以實現12V升壓24V、12V升壓36V、12V升壓4…

c 在文本終端中顯示yuv圖片

把yuv422 轉為rgb32 &#xff0c;利用framebuffer 顯示 #include <stdio.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <stdlib.h> #include <unistd.h> #include <sys/ioctl.h> #include <lin…

vue2.6源碼分析

vue相關文檔 vue-cli官方文檔 vuex官方文檔 vue-router 官方文檔 vue2.6源碼地址 如何調試源碼 package.json 添加了--sourcemap "scripts": {"dev": "rollup -w -c scripts/config.js --environment TARGET:web-full-dev --sourcemap" }新增…

linux apt update錯誤提示修復

錯誤提示&#xff1a; E: Release file for http://security.debian.org/dists/bullseye-security/InRelease is expired (invalid since 15d 14h 45min 26s). Updates for this repository will not be applied. E: Release file for http://ftp.jp.debian.org/debian/dists/b…

【Hello Go】Go語言并發編程

并發編程 概述基本概念go語言的并發優勢 goroutinegoroutine是什么創建goroutine如果主goroutine退出runtime包GoschedGoexitGOMAXPROCS channel無緩沖的channel有緩沖的channelrange和close單向channel 定時器TimerTicker Select超時 概述 基本概念 并行和并發概念 并行 &…

CVE-2023-6099:優卡特臉愛云一臉通智慧管理平臺SystemMng.ashx接口未授權漏洞復現

文章目錄 優卡特臉愛云一臉通智慧管理平臺未授權SystemMng.ashx接口漏洞復現&#xff08;CVE-2023-6099&#xff09; [附POC]0x01 前言0x02 漏洞描述0x03 影響版本0x04 漏洞環境0x05 漏洞復現1.訪問漏洞環境2.構造POC3.復現 0x06 修復建議 優卡特臉愛云一臉通智慧管理平臺未授權…

mysql字符串轉為數字的三種方法、字符串轉日期

隱式轉換 在MySQL中&#xff0c;使用0運算符可以將一個非數字的值隱式地轉換為數字。這在進行數學運算或比較操作時非常有用。 需要注意的是&#xff0c;在使用0進行隱式轉換時&#xff0c;MySQL會盡可能將字符串轉換為數字。如果字符串不能轉換為數字&#xff0c;則會返回0。…

【解決】HDFS JournalNode啟動慢問題排查

文章目錄 一. 問題描述二. 問題分析1. 排查機器性能2. DNS的問題 三. 問題解決 一句話&#xff1a;因為dns的問題導致journalnode啟動時很慢&#xff0c;通過修復dns對0.0.0.0域名解析&#xff0c;修復此問題。 一. 問題描述 從journalnode啟動到服務可用&#xff0c;完成RPC…

使用Python將圖片轉換為PDF

將圖片轉為 PDF 的主要原因之一是為了方便共享和傳輸。此外&#xff0c;將多張圖片合并成一個 PDF 文件還可以簡化文件管理。之前文章詳細介紹過如何使用第三方庫Spire.PDF for Python將PDF文件轉為圖片&#xff0c;那么本文介紹使用同樣工具在Python中實現圖片轉PDF文件的功能…

【OpenCV+OCR】計算機視覺:識別圖像驗證碼中指定顏色文字

文章目錄 1. 寫在前面2. 讀取驗證碼圖像3. 生成顏色掩碼4. 生成黑白結果圖5. OCR文字識別6. 測試結果 【作者主頁】&#xff1a;吳秋霖 【作者介紹】&#xff1a;Python領域優質創作者、阿里云博客專家、華為云享專家。長期致力于Python與爬蟲領域研究與開發工作&#xff01; 【…

Spring Security(安全框架,必須登錄成功才能訪問指定資源)

一、背景知識 1、Spring Security 是一個能夠為基于Spring的企業應用系統提供聲明式的安全訪問控制解決方案的安全框架。它提供了一組可以在Spring應用上下文中配置的Bean&#xff0c;充分利用了Spring IoC&#xff0c;DI&#xff08;IOC: 控制反轉Inversion of Control ,DI:D…

24路電磁鎖控板的特點和主要參數

智能快遞柜、智能生鮮柜、電子存儲柜、超市寄存柜、智能送餐柜、電子更衣柜、檔案柜等物聯網終端設備&#xff0c;都是采用電磁鎖控制&#xff0c;這種電磁鎖控制板俗稱鎖控板。鎖控板可以遠程控制儲物柜的開關以及遠程監控并提供鎖的反饋信號。沐渥開發的24路電磁鎖控板可以控…

AI:87-基于深度學習的街景圖像地理位置識別

?? 本文選自專欄:人工智能領域200例教程專欄 從基礎到實踐,深入學習。無論你是初學者還是經驗豐富的老手,對于本專欄案例和項目實踐都有參考學習意義。 ??? 每一個案例都附帶有在本地跑過的代碼,詳細講解供大家學習,希望可以幫到大家。歡迎訂閱支持,正在不斷更新中,…