C++_哈希

1. unordered系列關聯式容器

????????在C++98中,STL提供了底層為紅黑樹結構的一系列關聯式容器,在查詢時效率可達到$log_2 N$,即最差情況下需要比較紅黑樹的高度次,當樹中的節點非常多時,查詢效率也不理想。最好 的查詢是,進行很少的比較次數就能夠將元素找到,因此在C++11中,STL又提供了4個 unordered系列的關聯式容器,這四個容器與紅黑樹結構的關聯式容器使用方式基本類似,只是 其底層結構不同

哈希表與紅黑樹封裝出來的容器的區別

1undered_xxx是單向迭代器

2unordered_xxx遍歷出來不是有序

在用法上undered_xxx和xxx基本上沒什么區別就是底層的實現一個是哈希一個是紅黑樹

哈希: 存儲的值跟存儲的位置建立出一個對應的關系?

2. 底層結構

2.1哈希概念

順序結構以及平衡樹中,元素關鍵碼與其存儲位置之間沒有對應的關系,因此在查找一個元素 時,必須要經過關鍵碼的多次比較。順序查找時間復雜度為O(N),平衡樹中為樹的高度,即 O($log_2 N$),搜索的效率取決于搜索過程中元素的比較次數。

理想的搜索方法:可以不經過任何比較,一次直接從表中得到要搜索的元素。 如果構造一種存儲結構,通過某種函數(hashFunc)使元素的存儲位置與它的關鍵碼之間能夠建立 一一映射的關系,那么在查找時通過該函數可以很快找到該元素。

這種函數就是哈希函數,用來求一個哈希值

2.2哈希沖突

不同關鍵字通過相同哈希哈數計算出相同的哈希地址,該種現象稱為哈希沖突 或哈希碰撞。

2.3哈希函數

引起哈希沖突的一個原因就是哈希函數設計的不夠合理。

常見哈希函數

1 直接定址法

取關鍵字的某個線性函數為散列地址:Hash(Key)= A*Key + B

優點:簡單、均勻

缺點:需要事先知道關鍵字的分布情況

使用場景:適合查找比較小且連續的情況

2 除留余數法

設散列表中允許的地址數為m,取一個不大于m,但最接近或者等于m的質數p作為除數, 按照哈希函數:Hash(key) = key% p(p將關鍵碼轉換成哈希地址

3. 平方取中法--(了解)

4. 折疊法--(了解)

5. 隨機數法--(了解)

6. 數學分析法--(了解)

注意:哈希函數設計的越精妙,產生哈希沖突的可能性就越低,但是無法避免哈希沖突

2.4哈希沖突解決

1 閉散列-開放定址法

? ? ? ? 1.線性探測

? ? ? ? ? ? ? ?線性探測當遇到挨著的一系列值的時候,會發生擁堵

? ? ? ? ? ? ? ? 缺點就是你的位置被占用的時候最好不要取占用別人的位置

? ? ? ? ? ? ? ? 當刪除的時候,不能隨便刪除已有元素,而是用標記法來偽刪除一個元素

那么哈希表什么情況下發生擴容訥?如何擴容

線性探測的實現:

bool Insert(const pair<K, V>& kv)
{//通過載荷因子來判斷是否需要擴容if ((double)_n / (double)_table.size() >= 0.7){//這時候擴容,新創建一個表, 然后將舊表的數據插入到新的表里面//最后交換新舊表的_tableHashTable<K, V, HashiFunc> newTB;size_t newsize = _table.size() * 2;newTB._table.resize(newsize);for (size_t i = 0; i < _table.size(); i++){if (_table[i]._state == EXIST){newTB.Insert(_table[i]._kv);}}_table.swap(newTB._table);}//線性探索HashiFunc hfunc;size_t Hashi = hfunc(kv.first) % _table.size();while (_table[Hashi]._state != EMPTY){Hashi++;Hashi %= _table.size();}_table[Hashi]._kv = kv;_table[Hashi]._state = EXIST;_n++;return true;
}

? ? ? ? 2.二次探測

? ? ? ? 其實就是找空位置的方法是通過另外一種算hashi值的方法去找空位

?2 開散列-鏈地址法

????????開散列法又叫鏈地址法(開鏈法),首先對關鍵碼集合用散列函數計算散列地址,具有相同地 址的關鍵碼歸于同一子集合,每一個子集合稱為一個桶,各個桶中的元素通過一個單鏈表鏈 接起來,各鏈表的頭結點存儲在哈希表中。

從上圖可以看出,開散列中每個桶中放的都是發生哈希沖突的元素。

字符串哈希值的特殊算法:

template<class T>  
size_t BKDRHash(const T *str)  
{  register size_t hash = 0;  while (size_t ch = (size_t)*str++)  {         hash = hash * 131 + ch;         }  return hash;  
} 

2.5開散列與閉散列比較

應用鏈地址法處理溢出,需要增設鏈接指針,似乎增加了存儲開銷。事實上: 由于開地址法必須保持大量的空閑空間以確保搜索效率,如二次探查法要求裝載因子a ,而表項所占空間又比指針大的多,所以使用鏈地址法反而比開地址法節省存儲空間。

3. 模擬實現

模擬實現需要按照步驟完成

1、哈希表

注意這里傳的是T,T可以位K,也可以為pair<K,V>,封裝的時候再去處理

template <class T>
struct HashiNode
{T _Data;HashiNode<T>* next;HashiNode(const T& Data):_Data(Data),next(nullptr){}};

迭代器的實現

//前置聲明,因為這個迭代器里面用到了
template <class K, class T, class KeyOfT, class HashiFunc>
class HashBucket;template <class K, class T,class Ptr,class Ref, class KeyOfT, class HashiFunc>
struct HTIterator
{typedef HashiNode<T> Node;typedef HTIterator<K, T,Ptr,Ref, KeyOfT, HashiFunc> Self;typedef HTIterator<K, T, T*, T&, KeyOfT, HashiFunc> Iterator;Node* _node;const HashBucket<K, T, KeyOfT, HashiFunc>* _pht;//因為這里要傳一個表,在const_iterator//里面end()返回的是帶const修飾的HTIterator(Node* node,const HashBucket<K, T, KeyOfT, HashiFunc>* pht):_node(node),_pht(pht){}HTIterator(const Iterator& it):_node(it._node), _pht(it._pht){}Self& operator++(){//一個桶找完了之后要找到下一個桶if (_node->next){_node = _node->next;}else{KeyOfT kot;HashiFunc hf;size_t Hashi = hf(kot(_node->_Data))%_pht->_hashtable.size();++Hashi;//查找下一個不為空的桶while (Hashi < _pht->_hashtable.size()){if (_pht->_hashtable[Hashi]){_node = _pht->_hashtable[Hashi];return *this;}else{Hashi++;}}_node =  nullptr;}return *this;}bool operator!=(const Self& s){return _node != s._node;}Ref operator*(){return _node->_Data;}Ptr operator->(){return &_node->_Data;}};

哈希表的實現(底層用桶)

template <class K,class T, class KeyOfT,class HashiFunc>
class HashBucket
{typedef HashiNode<T> Node;template <class K, class T,class Ptr,class Ref, class KeyOfT, class HashiFunc>friend struct HTIterator;
public:typedef HTIterator<K, T,T*,T&, KeyOfT, HashiFunc> iterator;typedef HTIterator<K, T,const T*,const T&, KeyOfT, HashiFunc> const_iterator;iterator begin(){//找到第一個桶for (size_t i = 0; i < _hashtable.size(); i++){if (_hashtable[i]){return iterator(_hashtable[i], this);}}return iterator(nullptr, this);}iterator end(){return iterator(nullptr, this);}const_iterator begin()const{//找到第一個桶for (size_t i = 0; i < _hashtable.size(); i++){if (_hashtable[i]){return const_iterator(_hashtable[i], this);}}return const_iterator(nullptr, this);}const_iterator end()const{return const_iterator(nullptr, this);}HashBucket(){_hashtable.resize(10,nullptr);}~HashBucket(){for (size_t i = 0; i < _hashtable.size(); i++){Node* cur = _hashtable[i];Node* next = nullptr;while (cur){next = cur->next;delete cur;cur = next;}_hashtable[i] = nullptr;}}pair<iterator,bool> Insert(const T& Data){KeyOfT kot;iterator it = Find(kot(Data));if (it!=end()){return make_pair(it,false);}if (_n == _hashtable.size()){size_t newsize = _hashtable.size() * 2;vector<Node*> Newhb ;Newhb.resize(newsize, nullptr);//將原來表里面的數據插入到新的表里面for (size_t i = 0; i < _hashtable.size(); i++){Node* cur = _hashtable[i];while (cur){Node* next = cur->next;//頭插到新的表里面HashiFunc hf;size_t Hashi = hf(kot(cur->_Data)) % Newhb.size();cur->next = Newhb[Hashi];Newhb[Hashi] = cur;cur = next;}_hashtable[i] = nullptr;}_hashtable.swap(Newhb);}HashiFunc hf;size_t Hashi = hf(kot(Data)) % _hashtable.size();Node* newnode = new Node(Data);newnode->next = _hashtable[Hashi];_hashtable[Hashi] = newnode;_n++;return make_pair(iterator(newnode,this),true);}void Print(){for (size_t i = 0; i < _hashtable.size(); i++){Node* cur = _hashtable[i];printf("[%d]:", i);while (cur){//cout << cur->_Data << "->";cur = cur->next;}cout << "NULL";cout << endl;}}iterator Find(const K& key){HashiFunc hf;KeyOfT kot;size_t Hashi = hf(key) % _hashtable.size();Node* cur = _hashtable[Hashi];while (cur){if (kot(cur->_Data) == key){return iterator(cur, this);}cur = cur->next;}return end();}bool Earse(const K& key){HashiFunc hf;KeyOfT kot;size_t Hashi = hf(key) % _hashtable.size();Node* prev = nullptr;Node* cur = _hashtable[Hashi];if (kot(cur->_Data) == key){_hashtable[Hashi] = cur->next;delete cur;return true;}while (cur){if (kot(cur->_Data) == key){prev->next = cur->next;_n--;delete cur;return true;}prev = cur;cur = cur->next;}return false;}
private:vector<Node*> _hashtable;size_t _n = 0;
};

2、封裝map和set

set:

template<class K, class HashiFunc = DefHashiFunc<K>>
class unordered_set
{struct SetKeyOfT{const K& operator()(const K& key){return key;}};typedef typename Hash_Bucket::HashBucket<K, K, SetKeyOfT, HashiFunc>::const_iterator iterator;typedef typename Hash_Bucket::HashBucket<K, K, SetKeyOfT, HashiFunc>::const_iterator const_iterator;public:pair<iterator, bool> insert(const K& key){//return _ht.Insert(key);pair<typename Hash_Bucket::HashBucket<K, K, SetKeyOfT, HashiFunc>::iterator, bool> ret = _ht.Insert(key);return pair<const_iterator, bool>(ret.first, ret.second);}iterator begin()const{return _ht.begin();}iterator end()const{return _ht.end();}private:Hash_Bucket::HashBucket<K, K, SetKeyOfT, HashiFunc> _ht;
};

map:

template<class K,class V, class HashiFunc = DefHashiFunc<K>>
class unordered_map
{struct MapKeyOfT{const K& operator()(const pair<K,V>& kv){return kv.first;}};typedef typename Hash_Bucket::HashBucket<K, pair<K, V>, MapKeyOfT, HashiFunc>::iterator iterator;typedef typename Hash_Bucket::HashBucket<K, pair<const K, V>, MapKeyOfT, HashiFunc>::const_iterator const_iterator;public:pair<iterator,bool> insert(const pair<K, V>& kv){return _ht.Insert(kv);}iterator begin(){return _ht.begin();}iterator end(){return _ht.end();}V& operator[](const K& key){pair<iterator, bool> ret = _ht.Insert(make_pair(key, V()));return ret.first->second;}
private:Hash_Bucket::HashBucket<K, pair<K, V>, MapKeyOfT, HashiFunc> _ht;};

3、普通迭代器

4、const迭代器

5、insert返回值 operator[]

6、key不能修改的問題

4.哈希的應用

4.1 位圖

所謂位圖,就是用每一位來存放某種狀態,適用于海量數據,數據無重復的場景。通常是用 來判斷某個數據存不存在的。

位圖的實現:

template<size_t N>
class bitset
{
public:bitset(){_a.resize(N / 32 + 1);}void set(size_t x){size_t i = x / 32;size_t j = x % 32;_a[i] |= (1 << j);}void reset(size_t x){size_t i = x / 32;size_t j = x % 32;_a[i] &= (~(1 << j));}bool test(size_t x){size_t i = x / 32;size_t j = x % 32;return _a[i] & (1 << j);}
private:vector<int> _a;
};

位圖的應用

1. 快速查找某個數據是否在一個集合中

2. 排序 + 去重

3. 求兩個集合的交集、并集等

4. 操作系統中磁盤塊標記

//位圖就比較與我專業有點偏

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/96258.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/96258.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/96258.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis 內存管理機制:深度解析與性能優化實踐

&#x1f9e0; Redis 內存管理機制&#xff1a;深度解析與性能優化實踐 文章目錄&#x1f9e0; Redis 內存管理機制&#xff1a;深度解析與性能優化實踐&#x1f9e0; 一、Redis 內存架構全景&#x1f4a1; Redis 內存組成結構&#x1f4ca; 內存占用分布示例?? 二、內存分配…

cargs: 一個輕量級跨平臺命令行參數解析庫

目錄 1.簡介 2.安裝與集成 3.項目的目錄結構及介紹 4.核心數據結構與函數 5.基本使用示例 6.應用案例和最佳實踐 7.高級用法 8.與其他庫的對比 9.總結 1.簡介 cargs 是一個輕量級、無依賴的 C 語言命令行參數解析庫&#xff0c;雖然本身是 C 庫&#xff0c;但可以無縫…

【數學建模】質量消光系數在煙幕遮蔽效能建模中的核心作用

前言&#xff1a;歡迎各位光臨本博客&#xff0c;這里小編帶你直接手撕質量相關系數&#xff0c;文章并不復雜&#xff0c;愿諸君耐其心性&#xff0c;忘卻雜塵&#xff0c;道有所長&#xff01;&#xff01;&#xff01;&#xff01; **&#x1f525;個人主頁&#xff1a;IF’…

Java代碼審計實戰:XML外部實體注入(XXE)深度解析

Java代碼審計實戰&#xff1a;XML外部實體注入&#xff08;XXE&#xff09;深度解析XML外部實體注入&#xff08;XXE&#xff09;是Web應用程序中一種常見但又常常被忽視的漏洞。它利用了XML解析器解析XML文檔時&#xff0c;允許引用外部實體這個特性。如果解析器沒有禁用外部實…

當服務器出現網卡故障時如何檢測網卡硬件故障并解決?

當服務器出現網卡故障時&#xff0c;可能導致網絡通信中斷&#xff0c;從而影響業務的正常運行。以下是檢測網卡硬件故障、診斷問題并解決的詳細方法和步驟。1. 網卡故障的常見表現1.1 硬件故障的常見癥狀網絡無法連接&#xff1a;服務器無法訪問外部網絡或用戶無法連接到服務器…

從車輛中心到用戶中心:E/E架構的變革與挑戰

我是穿拖鞋的漢子,魔都中堅持長期主義的汽車電子工程師。 老規矩,分享一段喜歡的文字,避免自己成為高知識低文化的工程師: 做到欲望極簡,了解自己的真實欲望,不受外在潮流的影響,不盲從,不跟風。把自己的精力全部用在自己。一是去掉多余,凡事找規律,基礎是誠信;二是…

RPC內核細節(轉載)

RPC內核細節(轉載) 背景 隨著數據量、并發量、業務復雜度的增長&#xff0c;服務化是架構演進必由之路。服務化離不開RPC框架。 RPC服務化的好處 服務化的一個好處就是&#xff0c;不限定服務的提供方使用什么技術選型&#xff0c;能夠實現大公司跨團隊的技術解耦。 如下圖…

SpringAMQP 的發布方確認

前言 這里的發布方確認是以 SpringAMQP 寫的&#xff0c;之前我們在前面的篇章中就學過了 使用 Java 原生的SDK編寫&#xff0c;當時是發布確認模式&#xff0c;在這里我們將用 Spring 集成的 rabbitmq 方法來編寫 開啟發布者確認機制需要進行下面的配置&#xff0c;以 yml 為例…

一套自用的git提交規范,可清晰的識別到關聯的任務/bug

分享一套自用的git提交規范&#xff0c;可清晰的識別到關聯的任務/bug 一、提交信息的基本結構 推薦使用約定式提交的一種變體&#xff0c;結構如下&#xff1a; <類型>(<范圍>): <主題> [#<禪道-ID>]<正文>&#xff08;可選&#xff09;<腳注…

從音頻到文本實現高精度離線語音識別

會議頻繁&#xff0c;記錄繁瑣&#xff1f;語音轉換成文字工具價格高昂&#xff0c;自己手動整理又耗時費力&#xff1f; 它支持本地離線運行&#xff0c;無需聯網&#xff0c;所有數據留在本地&#xff0c;隱私安全毫無顧慮&#xff0c;同時它的功能是實時語音轉文字&#xf…

SpringMVC 工作原理

SpringMVC 工作原理 SpringMVC 是 Spring 框架中用于構建 Web 應用的核心模塊&#xff0c;其工作流程圍繞 “前端控制器&#xff08;DispatcherServlet&#xff09;” 展開&#xff0c;通過組件間的協作完成請求處理與響應。理解其工作原理是掌握 SpringMVC 開發的關鍵&#xf…

HoRain云--Python機器學習神器:Sklearn全解析

&#x1f3ac; HoRain云小助手&#xff1a;個人主頁 &#x1f525; 個人專欄: 《Linux 系列教程》《c語言教程》 ??生活的理想&#xff0c;就是為了理想的生活! ?? 推薦 前些天發現了一個超棒的服務器購買網站&#xff0c;性價比超高&#xff0c;大內存超劃算&#xff01;…

瘋狂星期四文案網第64天運營日記

網站運營第64天&#xff0c;點擊觀站&#xff1a; 瘋狂星期四 crazy-thursday.com 全網最全的瘋狂星期四文案網站 運營報告 今日訪問量 今日搜索引擎收錄情況

設計一個 AB 測試平臺

1. 需求明確化 功能需求實驗管理 創建、編輯、刪除、復制實驗設置實驗參數&#xff08;變體、權重、目標指標、時長等&#xff09;實驗狀態管理&#xff08;草稿、運行中、已結束&#xff09;用戶分流與分配 支持多種分流策略&#xff08;隨機分配、分層分配、定向分配&#xf…

HiCMAE 論文復現:基于 RAVDESS 數據集的音視頻情感識別

HiCMAE 論文復現:基于 RAVDESS 數據集的音視頻情感識別 1. 項目背景與論文概述 1.1 多模態情感識別背景 多模態情感識別是人工智能領域的重要研究方向,旨在通過結合多種感知模態(如音頻、視頻、文本等)來更準確地識別人類情感狀態。與傳統單模態方法相比,多模態方法能夠…

HarmonyOS 數據處理性能優化:算法 + 異步 + 分布式實戰

摘要 不管是寫 App&#xff0c;還是做 IoT 設備開發&#xff0c;數據處理都是繞不開的主題。你可能要處理幾百條傳感器數據&#xff0c;也可能要應對幾十萬條用戶行為日志。如果算法不夠高效&#xff0c;應用就會卡頓甚至直接崩潰。尤其是在 HarmonyOS&#xff08;鴻蒙系統&…

華為麒麟操作系統運維常見知識點

1.開放root賬號密碼登錄。(1)修改/etc/ssh/sshd_config文件中&#xff0c;PermitRootLogin 屬性值為yes。PermitRootLogin yes(2)使用passwd命令設置root密碼。sudo su 切換到root賬戶下&#xff0c;使用passwd 設置密碼。(3)重啟sshd服務。systemctl restart sshd2.避免使用ch…

嵌入式面試|MCU+RTOS技術棧——面試八股文整理3:STM32

目錄 1.單片機啟動流程 2.看門狗 3.最小系統 4.ROM、RAM、Flash 5.EPROM、EEPROM 6.Bootloader與OTA 7.NAND FLASH 和NOR FLASH 相同點 區別 適用場景 8.CPU、MPU、MCU、SOC、SOPC 9.交叉編譯 10.寄存器 寄存器的作用 寄存器與內存的區別 11.Cortex-M3寄存器組…

用 Wisdom SSH 輕松實現服務器自動化任務調度

用Wisdom SSH輕松實現服務器自動化任務調度 在服務器管理工作中&#xff0c;自動化任務調度至關重要&#xff0c;它能讓系統在特定時間自動執行預設任務&#xff0c;極大提升運維效率。Wisdom SSH作為一款具備AI助手的強大工具&#xff0c;為自動化任務調度帶來便捷解決方案。 …

遠場學習_FDTD_dipole(1)

項目4.4 Reflection calculation using a dipole source在此頁面中&#xff0c;我們采用了一種不同于標準平面波源方法的替代模擬設置&#xff0c;使用偶極子源來計算多層堆疊結構的反射。在此情況下&#xff0c;我們使用空氣 - 玻璃界面。這種技術很有吸引力&#xff0c;因為它…