BKD 樹(Block KD-Tree)Lucene

BKD 樹(Block KD-Tree)是 Lucene 用來存儲和快速查詢 **多維數值型數據** 的一種磁盤友好型數據結構,可以把它想成:

> **“把 KD-Tree 分塊壓縮后落到磁盤上,既能做磁盤順序讀,又能像內存 KD-Tree 一樣做范圍/最近鄰搜索。”**

核心要點(5 句話):

1. **存儲內容** ?
只存 **數值/日期/geo 點** 的多維坐標(int、long、float、double、geo_point …),**不存文本倒排**。

2. **結構** ?
? 依舊按 KD-Tree 方式遞歸切分維度; ?
? 每滿 1024 個點就寫成一個 **block**(順序磁盤頁),天然壓縮 & 緩存友好。 ?
? 所有葉子塊再建一個 **內存索引**(min-max 值 + 文件指針),查詢時先掃內存索引→定位少量磁盤塊→順序讀,幾乎無隨機 IO。

3. **支持的查詢** ?
? 范圍查詢:price ≥ 50 AND price < 100 ?
? 距離查詢:geo_distance 5 km 內 ?
? 最近鄰:knn_vector search ?
復雜度 **O(log N)**,且由于順序 IO,實際比 KD-Tree 在磁盤上快很多。

4. **優點** ?
? 磁盤順序讀友好 → SSD/HDD 都高效 ?
? 壓縮率極高 → 同樣數據體積 < 1/4 原始數組 ?
? 支持 **實時增刪改**(新文檔追加新 block,后臺合并)

5. **在 Elasticsearch 中的位置** ?
? 所有 `long`, `integer`, `double`, `date`, `ip`, `geo_point`, `geo_shape`, `dense_vector` 字段,**默認**就用 BKD 樹存維度數據; ?
? 因此 `range`, `geo_distance`, `knn` 查詢都走 BKD 而非倒排索引。

一句話: ?
**BKD 樹就是 Lucene 的“多維數值索引硬盤版”,讓范圍/距離/最近鄰查詢在磁盤上也像內存 KD-Tree 一樣快。**

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/914359.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/914359.shtml
英文地址,請注明出處:http://en.pswp.cn/news/914359.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Mysql作業】

第一次作業要求1.首先打開Windows PowerShell2.連接到MYSQL服務器3.執行以下SQL語句&#xff1a;-- 創建數據庫 CREATE DATABASE mydb6_product;-- 使用數據庫 USE mydb6_product;-- 創建employees表 CREATE TABLE employees (id INT PRIMARY KEY,name VARCHAR(50) NOT NULL,ag…

(C++)STL:list認識與使用全解析

本篇基于https://cplusplus.com/reference/list/list/講解 認識 list是一個帶頭結點的雙向循環鏈表翻譯總結&#xff1a; 序列容器&#xff1a;list是一種序列容器&#xff0c;允許在序列的任何位置進行常數時間的插入和刪除操作。雙向迭代&#xff1a;list支持雙向迭代&#x…

Bash函數詳解

目錄**1. 基礎函數****2. 參數處理函數****3. 文件操作函數****4. 日志與錯誤處理****5. 實用工具函數****6. 高級函數技巧****7. 常用函數庫示例****總結&#xff1a;Bash 函數核心要點**1. 基礎函數 1.1 定義與調用 可以自定義函數名稱&#xff0c;例如將greet改為yana。?…

Python爬蟲實戰:研究rows庫相關技術

1. 引言 在當今數字化時代,互聯網上存在著大量有價值的表格數據,這些數據以 HTML 表格、CSV、Excel 等多種格式存在。然而,由于數據源的多樣性和不規范性,表格結構往往存在復雜表頭、合并單元格、不規則數據行等問題,給數據的自動化處理帶來了巨大挑戰。 傳統的數據處理工…

通過同態加密實現可編程隱私和鏈上合規

1. 引言 2023年9月28日&#xff0c;a16z 的加密團隊發布了 Nakamoto Challenge&#xff0c;列出了區塊鏈中需要解決的最重要問題。尤其是其中的第四個問題格外引人注意&#xff1a;“合規的可編程隱私”&#xff0c;因為Zama團隊已經在這方面積極思考了一段時間。本文提出了使…

封裝---統一封裝處理頁面標題

一.采用工具來實現(setPageTitle.ts)多個頁面中用更統一的方式設置 document.title&#xff0c;可以封裝一個工具函數:在utils目錄下新建文件:setPageTitle.ts如果要在每個頁面設置相同的網站標志可以使用下面的appNameconst appName: string import.meta.env.VITE_APP_NAMEex…

JAVA學習筆記 首個HelloWorld程序-002

目錄 1 前言 2 開發首個程序 3 小結 1 前言 在所有的開發語言中&#xff0c;基本上首先程序就是輸出HelloWorld&#xff0c;這里也不例外。這個需要注意的是&#xff0c;程序的核心功能是數據輸出&#xff0c;是要有一個結果&#xff0c;可能沒有輸入&#xff0c;但是一定有…

智慧監所:科技賦能監獄管理新變革

1. 高清教育&#xff1a;告別模糊畫面&#xff0c;學習更清晰傳統電視的雪花屏終于成為歷史&#xff01;新系統采用高清傳輸&#xff0c;課件文字清晰可見&#xff0c;教學視頻細節分明。某監獄教育科王警官說&#xff1a;"現在播放法律課程&#xff0c;服刑人員能清楚看到…

專題:2025供應鏈數智化與效率提升報告|附100+份報告PDF、原數據表匯總下載

全文鏈接&#xff1a;https://tecdat.cn/?p42926 在全球產業鏈重構與數字技術革命的雙重驅動下&#xff0c;供應鏈正經歷從傳統經驗驅動向數據智能驅動的范式變革。從快消品產能區域化布局到垂類折扣企業的效率競賽&#xff0c;從人形機器人的成本優化到供應鏈金融對中小企業的…

uniapp+vue3+ts項目:實現小程序文件下載、預覽、進度監聽(含項目、案例、插件)

uniapp+vue3+ts項目:實現小程序文件下載、預覽、進度監聽(含項目、案例、插件) 支持封裝調用: 項目采用uniapp+vue3+ts +京東nutUI 開發nutUi文檔:loadingPage組件:https://uniapp-nutui.tech/components/exhibition/loadingpage.html案例效果圖: 略博主自留地:參考本地…

用Python和OpenCV從零搭建一個完整的雙目視覺系統(六 最終篇)

本系列文章旨在系統性地闡述如何利用 Python 與 OpenCV 庫&#xff0c;從零開始構建一個完整的雙目立體視覺系統。 本項目github地址&#xff1a;https://github.com/present-cjn/stereo-vision-python.git 1. 概述 歡迎來到本系列文章的最后一篇。在過去的幾篇文章中&#…

Android View 繪制流程 簡述 (無限遞歸+BitMap問題)

繪制流程 在 Android 的 View 系統中&#xff0c;draw(canvas) 和 dispatchDraw(canvas) 是繪制流程中的兩個關鍵方法&#xff1a; 1. draw(canvas) 方法的作用 draw(canvas) 是 View 類中的核心繪制方法&#xff0c;它的主要職責包括&#xff1a; 繪制背景 - 調用 drawBac…

算法學習筆記:18.拉斯維加斯算法 ——從原理到實戰,涵蓋 LeetCode 與考研 408 例題

在隨機化算法領域&#xff0c;拉斯維加斯&#xff08;Las Vegas&#xff09;算法以其獨特的設計思想占據重要地位。與蒙特卡洛&#xff08;Monte Carlo&#xff09;算法不同&#xff0c;拉斯維加斯算法總能給出正確的結果&#xff0c;但運行時間具有隨機性 —— 在最壞情況下可…

26-計組-指令執行過程

一、指令周期1. 定義與組成定義&#xff1a;CPU取出并執行一條指令所需的全部時間&#xff0c;稱為指令周期。子周期劃分&#xff1a;取指周期&#xff08;必選&#xff09;&#xff1a;從存儲器取指令到指令寄存器&#xff08;IR&#xff09;。間址周期&#xff08;可選&#…

【JMeter】數據驅動測試

文章目錄創建數據文件加載數據文件根據數據文件請求接口、傳遞參數拓展含義&#xff1a;根據數據的數量、內容&#xff0c;自動的決定用例的數據和內容。數據驅動測試用例。步驟&#xff1a; 創建數據文件加載數據文件根據數據文件請求接口、傳遞參數 創建數據文件 Jmeter支…

Springboot實現一個接口加密

首先來看效果這個主要是為了防止篡改請求的。 我們這里采用的是一個AOP的攔截&#xff0c;在有需要這樣的接口上添加了加密處理。 下面是一些功能防篡改HMAC-SHA256 參數簽名密鑰僅客戶端 & 服務器持有防重放秒級時間戳 有效窗口校驗默認允許 5 分鐘防竊聽AES/CBC/PKCS5Pa…

斯坦福 CS336 動手大語言模型 Assignment1 BPE Tokenizer TransformerLM

所有代碼更新至 https://github.com/WangYuHang-cmd/CS336/tree/main/assignment1-basics 作業文件結構: CS336/assignment1-basics/ ├── tests/ # 測試文件目錄 │ ├── adapters.py # 適配器測試 │ ├── conftest.py # pyt…

Spring Cloud Gateway 實戰指南

關鍵詞&#xff1a;微服務、API網關、Spring Cloud Gateway、路由轉發、限流熔斷 ? 文章摘要 隨著互聯網應用規模的不斷擴大&#xff0c;傳統的單體架構逐漸向微服務架構轉型。在微服務架構中&#xff0c;API 網關作為系統的入口點&#xff0c;承擔了諸如請求路由、負載均衡、…

PyTorch自動微分:從基礎到實戰

目錄 1. 自動微分是什么&#xff1f; 1.1 計算圖 1.2 requires_grad 屬性 2. 標量和向量的梯度計算 2.1 標量梯度 2.2 向量梯度 3. 梯度上下文控制 3.1 禁用梯度計算 3.2 累計梯度 4. 梯度下降實戰 4.1 求函數最小值 4.2 線性回歸參數求解 5. 總結 在深度學習中&a…

Spring AI 項目實戰(十六):Spring Boot + AI + 通義萬相圖像生成工具全棧項目實戰(附完整源碼)

系列文章 序號文章名稱1Spring AI 項目實戰(一):Spring AI 核心模塊入門2Spring AI 項目實戰(二):Spring Boot + AI + DeepSeek 深度實戰(附完整源碼)3Spring AI 項目實戰(三):Spring Boot + AI + DeepSeek 打造智能客服系統(附完整源碼)4