unordered_map/set的哈希封裝

【C++筆記】unordered_map/set的哈希封裝

🔥個人主頁大白的編程日記

🔥專欄C++筆記


文章目錄

  • 【C++筆記】unordered_map/set的哈希封裝
    • 前言
    • 一. 源碼及框架分析
    • 二.迭代器
    • 三.operator[]
    • 四.使用哈希表封裝unordered_map/set
    • 后言

前言

哈嘍,各位小伙伴大家好!上期我們講了哈希表的底層實現。今天我們來講一下unordered_map/set的哈希封裝。話不多說,我們進入正題!向大廠沖鋒
在這里插入圖片描述

一. 源碼及框架分析

SGI-STL30版本源代碼中沒有unordered_map和unordered_set,SGI-STL30版本是C++11之前的STL版本,這兩個容器是C++11之后才更新的。但是SGI-STL30實現了哈希表,只容器的名字是hash_map和hash_set,他是作為非標準的容器出現的,非標準是指非C++標準規定必須實現的,源代碼在
hash_map/hash_set/stl_hash_map/stl_hash_set/stl_hashtable.h中

hash_map和hash_set的實現結構框架核心部分截取出來如下:

// stl_hash_set
template <class Value, class HashFcn = hash<Value>,class EqualKey = equal_to<Value>,class Alloc = alloc>
class hash_set
{
private:typedef hashtable<Value, Value, HashFcn, identity<Value>,EqualKey, Alloc> ht;ht rep;
public:typedef typename ht::key_type key_type;typedef typename ht::value_type value_type;typedef typename ht::hasher hasher;typedef typename ht::key_equal key_equal;typedef typename ht::const_iterator iterator;typedef typename ht::const_iterator const_iterator;hasher hash_funct() const { return rep.hash_funct(); }key_equal key_eq() const { return rep.key_eq(); }
};
// stl_hash_map
template <class Key, class T, class HashFcn = hash<Key>,class EqualKey = equal_to<Key>,class Alloc = alloc>
class hash_map
{
private:typedef hashtable<pair<const Key, T>, Key, HashFcn,select1st<pair<const Key, T> >, EqualKey, Alloc> ht;ht rep;
public:typedef typename ht::key_type key_type;typedef T data_type;typedef T mapped_type;typedef typename ht::value_type value_type;typedef typename ht::hasher hasher;typedef typename ht::key_equal key_equal;typedef typename ht::iterator iterator;typedef typename ht::const_iterator const_iterator;
};
// stl_hashtable.h
template <class Value, class Key, class HashFcn,class ExtractKey, class EqualKey,class Alloc>
class hashtable {
public:typedef Key key_type;typedef Value value_type;typedef HashFcn hasher;typedef EqualKey key_equal;
private:hasher hash;key_equal equals;ExtractKey get_key;typedef __hashtable_node<Value> node;vector<node*, Alloc> buckets;size_type num_elements;
public:typedef __hashtable_iterator<Value, Key, HashFcn, ExtractKey, EqualKey,Alloc> iterator;pair<iterator, bool> insert_unique(const value_type& obj);const_iterator find(const key_type& key) const;
};
template <class Value>
struct __hashtable_node
{__hashtable_node* next;Value val;
};
  • 框架分析
    這里我們就不再畫圖分析了,通過源碼可以看到,結構上hash_map和hash_set跟map和set的完全類似,復用同一個hashtable實現key和key/value結構,通過一個參數T來封裝map和set,hash_set傳給hash_table的是key,hash_map傳給hash_table的是pair<const key, value>。通過仿函數取出T中的key。同時哈希表還要多傳一個哈希函數的仿函數。

二.迭代器

  • iterator實現的大框架跟list的iterator思路是一致的,用?個類型封裝結點的指針,再通過重載運算符實現,迭代器像指針?樣訪問的行為,要注意的是哈希表的迭代器是單向迭代器。
  • 這里的難點是operator++的實現。iterator中有?個指向結點的指針,如果當前桶下面還有結點,則結點的指針指向下?個結點即可。如果當前桶走完了,則需要想辦法計算找到下?個桶。這里的難點是反而是結構設計的問題,參考上面的源碼,我們可以看到iterator中除了有結點的指針,還有哈希表對象的指針,這樣當前桶走完了,要計算下一個桶就相對容易多了,用key值計算出當前桶位置,依次往后找下?個不為空的桶即可。
  • begin()返回第?個不為空的桶中第?個節點指針構造的迭代器,這里end()返回迭代器可以用空表示。
  • unordered_set的iterator也不支持修改,我們把unordered_set的第?個模板參數改成const K即
    可, HashTable<K, const K, SetKeyOfT, Hash> _ht;
  • unordered_map的iterator不支持修改key但是可以修改value,我們把unordered_map的第二個模板參數pair的第?個參數改成const K即可, HashTable<K, pair<const K, V>,MapKeyOfT, Hash> _ht;

三.operator[]

unoredered_map實現operator[]主要是通過insert支持。
通過insert返回的pair中的迭代器,再返回迭代器中數據即可

v& operator[](const k& key)
{pair<iterator, bool> ret = insert({ key,v()});return ret.first._node->_data.second;
}

四.使用哈希表封裝unordered_map/set

  • 其次跟map和set相比而言unordered_map和unordered_set的模擬實現類結構更復雜?點,但是
    大框架和思路是完全類似的。因為HashTable實現了泛型不知道T參數導致是K,還是pair<K, V>,
    那么insert內部進行插入時要用K對象轉換成整形取模和K比較相等,因為pair的value不參與計算取模,且默認支持的是key和value?起比較相等,我們需要時的任何時候只需要比較K對象,所以我們在unordered_map和unordered_set層分別實現?個MapKeyOfT和SetKeyOfT的仿函數傳給HashTable的KeyOfT,然后HashTable中通過KeyOfT仿函數取出T類型對象中的K對象,再轉換成整形取模和K比較相等,具體細節參考如下代碼實現。
	template<class T>struct HashData{HashData<T>* _next;T _data;HashData(const T& key):_next(nullptr),_data(key){}};template<class k, class T, class KeyofT, class HashFun>class HashTable;//前置聲明,解決相互依賴template<class k, class T, class Ref, class Ptr, class KeyofT, class HashFun>struct HashIterator{using node = HashData<T>;using self = HashIterator<k, T, Ref, Ptr, KeyofT, HashFun>;using ht = HashTable<k, T, KeyofT, HashFun>;const ht* _ht;node* _node;HashIterator(const ht* const& HT,node* node):_ht(HT), _node(node){}Ref operator*(){return _node->_data;}Ptr operator&(){return &_node->_data;}bool operator==(const self& tmp) const{return _node == tmp._node;}bool operator!=(const self& tmp) const{return _node != tmp._node;}self& operator++(){KeyofT kot;HashFun hash;if (_node->_next){_node = _node->_next;}else{size_t hash0 = hash(kot(_node->_data)) % _ht->_table.size();hash0++;while (hash0<_ht->_table.size()){if (_ht->_table[hash0]){break;}else{hash0++;}}if (hash0 == _ht->_table.size()){_node = nullptr;}else{_node = _ht->_table[hash0];}}return *this;}};template<class k, class T, class KeyofT, class HashFun>class HashTable{template<class k, class T, class Ref, class Ptr, class KeyofT, class HashFun>friend struct HashIterator;//友元聲明public:HashTable():_table(__stl_next_prime(0)), _n(0){}using node = HashData<T>;using Iterator = HashIterator<k, T, T&, T*, KeyofT, HashFun>;using Const_Iterator=HashIterator<k, T, const T&, const T*, KeyofT, HashFun>;Iterator  End(){return Iterator(this, nullptr);}Iterator  Begin(){for (int i = 0; i < _table.size(); i++){if (_table[i]){return Iterator(this, _table[i]);}}return End();}Const_Iterator End() const{return Const_Iterator(this, nullptr);}Const_Iterator Begin() const{for (int i = 0; i < _table.size(); i++){if (_table[i]){return Const_Iterator(this, _table[i]);}}return End();}pair<Iterator,bool> Insert(const T& kv){HashFun hash;KeyofT kot;Iterator it = Find(kot(kv));if (it!=End()){return { it,false };}if (_n * 10 / _table.size() >= 7){vector<node*> newtable;newtable.resize(__stl_next_prime(newtable.size() + 1));for (auto& x : _table){node* cur = x;x = nullptr;while (cur){size_t hash0 = hash(kot(cur->_data)) % newtable.size();node* next = cur->_next;cur->_next=newtable[hash0];newtable[hash0] = cur;cur = next;}}_table.swap(newtable);}size_t hash0 = hash(kot(kv)) % _table.size();node* cur = new node(kv);cur->_next = _table[hash0];_table[hash0] = cur;_n++;return { Iterator(this,cur),true};}Iterator Find(const k& key){HashFun hash;KeyofT kot;size_t hash0 = hash(key) % _table.size();node* cur = _table[hash0];while (cur){if (kot(cur->_data) == key){return Iterator(this, cur);}cur = cur->_next;}return End();}bool Erase(const k& key){HashFun hash;KeyofT kot;size_t hash0 = hash(key) % _table.size();node* cur = _table[hash0];node* pre = nullptr;while (cur){if (kot(cur->_data) == key){if (cur == _table[hash0]){_table[hash0] = cur->_next;}else{pre->_next = cur->_next;}return true;}else{pre = cur;cur = cur->_next;}}return false;}private:vector<node*> _table;size_t _n;};


后言

這就是unordered_map/set的哈希封裝。大家自己好好消化!今天就分享到這!感謝各位的耐心垂閱!咱們下期見!拜拜~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894664.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894664.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894664.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

編程AI深度實戰:大模型哪個好? Mistral vs Qwen vs Deepseek vs Llama

?? 系列文章&#xff1a; 編程AI深度實戰&#xff1a;私有模型deep seek r1&#xff0c;必會ollama-CSDN博客 編程AI深度實戰&#xff1a;自己的AI&#xff0c;必會LangChain-CSDN博客 編程AI深度實戰&#xff1a;給vim裝上AI-CSDN博客 編程AI深度實戰&#xff1a;火的編…

neo4j-community-5.26.0 install in window10

在住處電腦重新配置一下neo4j, 1.先至官方下載 Neo4j Desktop Download | Free Graph Database Download Neo4j Deployment Center - Graph Database & Analytics 2.配置java jdk jdk 21 官網下載 Java Downloads | Oracle 中國 path: 4.查看java -version 版本 5.n…

【怎么用系列】短視頻戒除—1—對推薦算法進行干擾

如今推薦算法已經滲透到人們生活的方方面面&#xff0c;尤其是抖音等短視頻核心就是推薦算法。 【短視頻的危害】 1> 會讓人變笨&#xff0c;慢慢讓人喪失注意力與專注力 2> 讓人喪失閱讀長文的能力 3> 讓人沉浸在一個又一個快感與嗨點當中。當我們刷短視頻時&#x…

網絡原理(5)—— 數據鏈路層詳解

目錄 一. 以太網 1.1 認識以太網 1.2 網卡與以太網 1.3 以太網幀格式 二. 認識MAC地址 三. MAC地址 與 IP地址 的區別 4.1 定義 4.2 分配方式 4.3 工作層次 4.4 地址格式 4.5 尋址方式 四. ARP協議 4.1 引入 4.2 ARP的概念 4.3 ARP工作原理 五. MTU 與 MSS …

【從零開始的LeetCode-算法】922. 按奇偶排序數組 II

給定一個非負整數數組 nums&#xff0c; nums 中一半整數是 奇數 &#xff0c;一半整數是 偶數 。 對數組進行排序&#xff0c;以便當 nums[i] 為奇數時&#xff0c;i 也是 奇數 &#xff1b;當 nums[i] 為偶數時&#xff0c; i 也是 偶數 。 你可以返回 任何滿足上述條件的…

設計一個特殊token以從1億詞表中動態采樣8192個詞來表達當前序列

為了設計一個特殊token以從1億詞表中動態采樣8192個詞來表達當前序列&#xff0c;可以采用以下分步方案&#xff1a; 1. 特殊token的設計與作用 定義特殊token&#xff1a;在輸入序列前添加一個特殊標記&#xff0c;如[SUBVOCAB]。該token的嵌入包含觸發子詞表采樣的元信息。…

兩晉南北朝 僑置州郡由來

僑置的核心思想是面向人管理 而不是面向土地 1. 北雍州 西晉于長安置雍州&#xff0c;永嘉之亂&#xff0c;沒于劉、石。苻秦之亂&#xff0c;雍州流民南出樊沔&#xff0c;孝武于襄陽僑立雍州。此時稱長安為北雍州。

H264原始碼流格式分析

1.H264碼流結構組成 H.264裸碼流&#xff08;Raw Bitstream&#xff09;數據主要由一系列的NALU&#xff08;網絡抽象層單元&#xff09;組成。每個NALU包含一個NAL頭和一個RBSP&#xff08;原始字節序列載荷&#xff09;。 1.1 H.264碼流層次 H.264碼流的結構可以分為兩個層…

【C語言設計模式學習筆記1】面向接口編程/簡單工廠模式/多態

面向接口編程可以提供更高級的抽象&#xff0c;實現的時候&#xff0c;外部不需要知道內部的具體實現&#xff0c;最簡單的是使用簡單工廠模式來進行實現&#xff0c;比如一個Sensor具有多種表示形式&#xff0c;這時候可以在給Sensor結構體添加一個enum類型的type&#xff0c;…

AI大模型(二)基于Deepseek搭建本地可視化交互UI

AI大模型&#xff08;二&#xff09;基于Deepseek搭建本地可視化交互UI DeepSeek開源大模型在榜單上以黑馬之姿橫掃多項評測&#xff0c;其社區熱度指數暴漲、一躍成為近期內影響力最高的話題&#xff0c;這個來自中國團隊的模型向世界證明&#xff1a;讓每個普通人都能擁有媲…

C++基礎系列【2】C++基本語法

本文作為入門文檔&#xff0c;簡要介紹C的非常基本的語法&#xff0c;后面章節會詳細介紹C的各個語法。 C 程序結構 C程序的基本結構包括頭文件、命名空間、類和函數等。 下面我們通過Hello&#xff0c;World來展示這些元素。 #include <iostream> // 包含標準輸入輸…

【C語言】球球大作戰游戲

目錄 1. 前期準備 2. 玩家操作 3. 生成地圖 4. 敵人移動 5. 吃掉小球 6. 完整代碼 1. 前期準備 游戲設定:小球的位置、小球的半徑、以及小球的顏色 這里我們可以用一個結構體數組來存放這些要素,以方便初始化小球的信息。 struct Ball {int x;int y;float r;DWORD c…

圖的基本術語——非八股文

我之前只看到了數據結構與算法的冰山一角&#xff0c;感覺這些術語只會讓知識越來越難理解&#xff0c;現在來看&#xff0c;他們完美抽象一些概念和知識&#xff0c;非常重要。 本篇概念肯定總結不全&#xff0c;只有遇到的會寫上&#xff0c;持續更新&#xff0c;之前文章已經…

oracle: 表分區>>范圍分區,列表分區,散列分區/哈希分區,間隔分區,參考分區,組合分區,子分區/復合分區/組合分區

分區表 是將一個邏輯上的大表按照特定的規則劃分為多個物理上的子表&#xff0c;這些子表稱為分區。 分區可以基于不同的維度&#xff0c;如時間、數值范圍、字符串值等&#xff0c;將數據分散存儲在不同的分區 中&#xff0c;以提高數據管理的效率和查詢性能&#xff0c;同時…

【單層神經網絡】基于MXNet的線性回歸實現(底層實現)

寫在前面 剛開始先從普通的尋優算法開始&#xff0c;熟悉一下學習訓練過程下面將使用梯度下降法尋優&#xff0c;但這大概只能是局部最優&#xff0c;它并不是一個十分優秀的尋優算法 整體流程 生成訓練數據集&#xff08;實際工程中&#xff0c;需要從實際對象身上采集數據…

本地快速部署DeepSeek-R1模型——2025新年賀歲

一晃年初六了&#xff0c;春節長假余額馬上歸零了。今天下午在我的電腦上成功部署了DeepSeek-R1模型&#xff0c;抽個時間和大家簡單分享一下過程&#xff1a; 概述 DeepSeek模型 是一家由中國知名量化私募巨頭幻方量化創立的人工智能公司&#xff0c;致力于開發高效、高性能…

C++11詳解(一) -- 列表初始化,右值引用和移動語義

文章目錄 1.列表初始化1.1 C98傳統的{}1.2 C11中的{}1.3 C11中的std::initializer_list 2.右值引用和移動語義2.1左值和右值2.2左值引用和右值引用2.3 引用延長生命周期2.4左值和右值的參數匹配問題2.5右值引用和移動語義的使用場景2.5.1左值引用主要使用場景2.5.2移動構造和移…

在K8S中,pending狀態一般由什么原因導致的?

在Kubernetes中&#xff0c;資源或Pod處于Pending狀態可能有多種原因引起。以下是一些常見的原因和詳細解釋&#xff1a; 資源不足 概述&#xff1a;當集群中的資源不足以滿足Pod或服務的需求時&#xff0c;它們可能會被至于Pending狀態。這通常涉及到CPU、內存、存儲或其他資…

手寫MVVM框架-構建虛擬dom樹

MVVM的核心之一就是虛擬dom樹&#xff0c;我們這一章節就先構建一個虛擬dom樹 首先我們需要創建一個VNode的類 // 當前類的位置是src/vnode/index.js export default class VNode{constructor(tag, // 標簽名稱&#xff08;英文大寫&#xff09;ele, // 對應真實節點children,…

linux內核源代碼中__init的作用?

在 Linux 內核源代碼中&#xff0c;__init是一個特殊的宏&#xff0c;用于標記在內核初始化階段使用的變量或函數。這個宏的作用是告訴內核編譯器和鏈接器&#xff0c;被標記的變量或函數只在內核的初始化階段使用&#xff0c;在系統啟動完成后就不再需要了。因此&#xff0c;這…