Hutool - BloomFilter:便捷的布隆過濾器實現

1. 布隆過濾器簡介

布隆過濾器(Bloom Filter)是一種空間效率極高的概率型數據結構,用于判斷一個元素是否存在于一個集合中。它的優點是空間效率和查詢時間都遠遠超過一般的算法,但缺點是有一定的誤判率,即判斷元素存在時,元素可能實際上并不存在,但判斷元素不存在時,元素一定不存在。布隆過濾器在很多場景下都有廣泛的應用,比如緩存穿透的防止、URL 去重等。

2. Hutool - BloomFilter 概述

Hutool - BloomFilter 是 Hutool 工具包中的一個模塊,它提供了一些基于不同 Hash 算法的布隆過濾器實現,讓我們可以方便地在 Java 項目中使用布隆過濾器。

3. 引入依賴

如果你使用 Maven 管理項目,在 pom.xml 中添加以下依賴:

 
<dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.16</version>
</dependency>

4. 基本使用示例

下面通過一個簡單的示例來展示如何使用 Hutool - BloomFilter。

import cn.hutool.bloomfilter.BloomFilterUtil;
import cn.hutool.bloomfilter.bitMap.DefaultBitMap;
import cn.hutool.bloomfilter.filter.MurmurFilter;public class BloomFilterExample {public static void main(String[] args) {// 初始化布隆過濾器,指定預期元素數量和誤判率int expectedInsertions = 1000;double fpp = 0.01;MurmurFilter bloomFilter = (MurmurFilter) BloomFilterUtil.create(new DefaultBitMap(), expectedInsertions, fpp);// 向布隆過濾器中添加元素String element1 = "apple";String element2 = "banana";bloomFilter.add(element1);bloomFilter.add(element2);// 判斷元素是否存在于布隆過濾器中boolean contains1 = bloomFilter.contains(element1);boolean contains2 = bloomFilter.contains("cherry");System.out.println("布隆過濾器中是否包含 " + element1 + ": " + contains1);System.out.println("布隆過濾器中是否包含 cherry: " + contains2);}
}

5. 代碼解釋
  • 初始化布隆過濾器

    • expectedInsertions 表示預期要插入布隆過濾器的元素數量。

    • fpp 表示允許的誤判率,這里設置為 0.01,即 1% 的誤判可能性。

    • BloomFilterUtil.create 方法用于創建布隆過濾器,DefaultBitMap 是 Hutool 提供的一種位圖實現,用于存儲布隆過濾器的狀態。

  • 添加元素:使用 add 方法向布隆過濾器中添加元素。

  • 判斷元素是否存在:使用 contains 方法判斷元素是否存在于布隆過濾器中。

6. 不同 Hash 算法的布隆過濾器

Hutool - BloomFilter 提供了多種基于不同 Hash 算法的布隆過濾器實現,除了上面示例中使用的 MurmurFilter,還有 FnvFilter 等。你可以根據實際需求選擇合適的布隆過濾器。

import cn.hutool.bloomfilter.BloomFilterUtil;
import cn.hutool.bloomfilter.bitMap.DefaultBitMap;
import cn.hutool.bloomfilter.filter.FnvFilter;public class DifferentHashBloomFilterExample {public static void main(String[] args) {int expectedInsertions = 1000;double fpp = 0.01;FnvFilter bloomFilter = (FnvFilter) BloomFilterUtil.create(new DefaultBitMap(), expectedInsertions, fpp);// 添加元素和判斷元素是否存在的操作與上面示例類似}
}

7. 注意事項
  • 誤判率:布隆過濾器存在一定的誤判率,在使用時需要根據具體場景合理設置誤判率。誤判率越低,所需的空間就越大。

  • 數據持久化:Hutool - BloomFilter 默認沒有提供數據持久化的功能,如果需要在程序重啟后繼續使用布隆過濾器中的數據,需要自行實現數據持久化邏輯。

通過使用 Hutool - BloomFilter,我們可以方便快捷地在 Java 項目中使用布隆過濾器,解決一些實際的業務問題,如緩存穿透、數據去重等。

學習更多知識點擊下面鏈接

偷偷的學Java

Java業務系統應用技術

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895499.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895499.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895499.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

日常知識點之遺留問題梳理(定時器/時間輪定時器)

1&#xff1a;簡單基礎 定時器的核心知識點&#xff0c;對我來說就是獲取當前時間和設置回調函數。 簡單練習&#xff1a; ? c語言通過gettimeofday 獲取當前時間并進行處理 ? 回調函數的定義&#xff08;函數參數有必要適當存儲&#xff09; typedef void(Timerfunc)(vo…

Python + WhisperX:解鎖語音識別的高效新姿勢

大家好&#xff0c;我是烤鴨&#xff1a; 最近在嘗試做視頻的質量分析&#xff0c;打算利用asr針對聲音判斷是否有人聲&#xff0c;以及識別出來的文本進行進一步操作。asr看了幾個開源的&#xff0c;最終選擇了openai的whisper&#xff0c;后來發現性能不行&#xff0c;又換了…

$ npx electron-forge import 一直報權限問題 resource busy or locked,

jackLAPTOP-7DHDAAL0 MINGW64 /e/project/celetron-project/my-electron-app (master) $ npx electron-forge import > Checking your system > Checking git exists > Checking node version > Checking packageManager version √ Found node22.14.0 √ Found gi…

mapbox 從入門到精通 - 目錄

&#x1f468;??? 主頁&#xff1a; gis分享者 &#x1f468;??? 感謝各位大佬 點贊&#x1f44d; 收藏? 留言&#x1f4dd; 加關注?! &#x1f468;??? 收錄于專欄&#xff1a;mapbox 從入門到精通 文章目錄 一、&#x1f340;總目錄1.1 ?? mapbox基礎1.2 ??…

Kotlin 2.1.0 入門教程(十五)繼承、重寫、派生類初始化順序

繼承 所有類都有一個共同的超類 Any&#xff0c;對于沒有聲明超類型的類來說&#xff0c;Any 是其默認的超類&#xff1a; // 隱式繼承自 Any。 class ExampleAny 有三個方法&#xff1a;equals()、hashCode() 和 toString()。因此&#xff0c;所有類都定義了這些方法。 默認…

sqlilabs--小實驗

一、先盲注判斷 ?id1 and sleep(2)-- 如果發現頁面存在注點&#xff0c;使用時間盲注腳本進行注入 import requestsdef inject_database(url):name for i in range(1, 20): # 假設數據庫名稱長度不超過20low 48 # 0high 122 # zmiddle (low high) // 2while low &l…

【數字】異步FIFO面試的幾個小問題與跨時鐘域時序約束

入門數字設計的時候&#xff0c;跨時鐘域的數據處理是繞不開的課題&#xff0c;特別是多比特數據跨時鐘域時&#xff0c;都會采用異步FIFO的方法。 異步FIFO中涉及較多的考點這里記錄幾個以供大家參考。 1. 異步FIFO的空滿判斷分別在哪個域&#xff1f; 根據異步FIFO的結構&…

淺談Java Spring Boot 框架分析和理解

Spring Boot是一個簡化Spring開發的框架&#xff0c;它遵循“約定優于配置”的原則&#xff0c;通過內嵌的Tomcat、Jetty或Undertow等容器&#xff0c;使得開發者能夠快速構建獨立運行的、生產級別的基于Spring框架的應用程序。Spring Boot包含了大量的自動配置功能&#xff0c…

算法06-回溯算法

一、回溯算法詳解 回溯算法是一種通過逐步構建解決方案來解決問題的算法。它通常用于解決組合問題、排列問題、子集問題等。回溯算法的核心思想是“試錯”&#xff0c;即在每一步嘗試所有可能的選項&#xff0c;如果發現當前選擇無法達到目標&#xff0c;就回退到上一步&#…

RabbitMQ學習—day2—安裝

目錄 普通Linux安裝 安裝RabbitMQ 1、下載 2、安裝 3. Web管理界面及授權操作 Docker 安裝 強力推薦學docker&#xff0c;使用docker安裝 普通Linux安裝 安裝RabbitMQ 1、下載 官網下載地址&#xff1a;https://www.rabbitmq.com/download.html(opens new window) 這…

降本增效 - VGF 構建輕量高性能日志管理平臺

VFG 技術架構 Filebeat 接收Syslog &#xff0c;并進行日志分段&#xff0c;VictoriaLogs 持久化存儲日志 &#xff0c;Grafana 可視化、數據查詢、告警、數據導出。 為什么要用VictoriaLogs &#xff1f; 與Elasticsearch /Grafana Loki相比幾十倍的CPU/內存/存儲資源占用的…

初識camel智能體(一)

同目錄下配置環境變量.env&#xff0c;內容如下&#xff0c; apikey從魔搭社區獲取 QWEN_API_KEY4ff3ac8f-aebc******** 先上干貨代碼&#xff0c;主代碼如下&#xff1a; from colorama import Forefrom camel.societies import RolePlaying from camel.utils import prin…

介紹 Liquibase、Flyway、Talend 和 Apache NiFi:選擇適合的工具

在現代軟件開發中&#xff0c;尤其是在數據庫管理和數據集成方面&#xff0c;選擇合適的工具至關重要。本文將介紹四個流行的工具&#xff1a;Liquibase、Flyway、Talend 和 Apache NiFi&#xff0c;分析它們的應用、依賴以及如何選擇適合的工具。 1. Liquibase 簡介&#xff…

Docker使用指南與Dockerfile文件詳解:從入門到實戰

Docker使用指南與Dockerfile文件詳解:從入門到實戰 文章目錄 **Docker使用指南與Dockerfile文件詳解:從入門到實戰****引言****第一部分:Docker 核心概念速覽****1. Docker 基礎架構****2. Docker 核心命令****第二部分:Dockerfile 文件深度解析****1. Dockerfile 是什么?…

Qt工作總結03 <qSort按某一屬性進行排序>

1. 代碼樣例 QList<QGraphicsTextItem *> Lst;qSort(Lst.begin(),Lst.end(),[](const QGraphicsTextItem *itemA,const QGraphicsTextItem *itemB) {return itemA->toPlainText().toDouble() < itemB->toPlainText().toDouble(); }); 2. 參考 QList 按結構體…

深度學習|表示學習|Instance Normalization 全面總結|26

如是我聞&#xff1a; 1. Instance Normalization&#xff08;IN&#xff09; Instance Normalization&#xff08;IN&#xff09;最早由 Ulyanov et al.&#xff08;2017&#xff09; 提出&#xff0c;主要用于 風格遷移&#xff08;Style Transfer&#xff09; 任務。它的核…

如何保持 mysql 和 redis 中數據的一致性?PegaDB 給出答案

MySQL 與 Redis 數據保持一致性是一個常見且復雜的問題&#xff0c;一般來說需要結合多種策略來平衡性能與一致性。 傳統的解決策略是先讀緩存&#xff0c;未命中則讀數據庫并回填緩存&#xff0c;但方式這種維護成本較高。 隨著云數據庫技術的發展&#xff0c;目前國內云廠商…

探索ELK 的魅力

在大數據時代&#xff0c;海量日志和數據的收集、存儲、處理與可視化分析變得越來越重要。而 ELK 堆棧&#xff0c;由 Elasticsearch、Logstash、Beats 和 Kibana 組成&#xff0c;正是一個強大的開源解決方案&#xff0c;幫助開發者和運維人員高效管理和分析日志數據。本文將詳…

用vue3寫一個好看的wiki前端頁面

以下是一個使用 Vue 3 Element Plus 實現的 Wiki 風格前端頁面示例&#xff0c;包含現代設計、響應式布局和常用功能&#xff1a; <template><div class"wiki-container"><!-- 頭部導航 --><el-header class"wiki-header"><d…

深度學習實戰基礎案例——卷積神經網絡(CNN)基于DenseNet的眼疾檢測|第4例

文章目錄 前言一、數據準備二、項目實戰2.1 設置GPU2.2 數據加載2.3 數據預處理2.4 數據劃分2.5 搭建網絡模型2.6 構建densenet1212.7 訓練模型2.8 結果可視化 三、UI設計四、結果展示總結 前言 在當今社會&#xff0c;眼科疾病尤其是白內障對人們的視力健康構成了嚴重威脅。白…