Elasticsearch的索引

正向索引和倒排索引

  1. 什么是正向索引?

    傳統的數據庫采用正向索引,如MySQL將表中的id創建索引,正向索引在進行不是id為索引進行搜索的時候,會逐條進行查詢,比方說

    上圖的表格,數據庫進行逐條查詢,當掃描到搜索字的時候會將該行存入結果集當中,如果沒有就會進行丟棄。

    倒排索引
    1. elasticsearch采用的就是倒排索引它將要搜索的數據進行劃分:

      • 文檔(document):每條數據就是一個文檔

      • 詞條(term):文檔按照語義分成的詞語

    2. 如上表,當用戶用倒排索引進行搜索的時候,會劃分一個新的索引表,將原來的數據當中的東西,通過關鍵字進行劃分,當有相同的時候會在文檔的后面增加上索引,當有新的時候會創建出來一行新的數據,依此類推。

當用戶搜索的時候,如上圖比方說小米和手機,會先將搜索詞進行語義的劃分,然后在詞條列表當中進行查詢,將包含這兩個詞條的文檔id都進行列舉,再根據文檔id進行查詢,最后根據匹配度對其進行排序,存到結果集當中。

  1. 總結:

    什么是正向索引?

    • 基于文檔id創建索引。查詢詞條時必須先找到文檔,而后判斷是否包 含詞條

    什么是倒排索引?

    • 對文檔內容分詞,對詞條創建索引,并記錄詞條所在文檔的信息。查詢時先根據詞條查詢到文檔id,而后獲取到文檔

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908988.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908988.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908988.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

分散電站,集中掌控,安科瑞光伏云平臺助力企業綠色轉型

本項目位于香港全境共計52個分布式光伏站,總裝機容量8.6MW。發電模式自發自用,余電上網,逆變器采用陽光電源SG100CX、SG20RT等12種型號共計103臺,其余型號共計15臺。每個站點均配置氣象站。 項目采用AcrelCloud-1200分布式光伏運…

開發記錄:修復一些Bug,并實現兩個功能

開發記錄: 📋 工作概述 到今天主要完成了AI閱讀助手的兩大核心功能:前情提要和名詞解釋,并對相關交互體驗進行了優化。通過流式SSE技術實現了實時AI內容生成,大幅提升了用戶體驗。 🎯 主要完成功能 1…

LLM基礎1_語言模型如何處理文本

基于GitHub項目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介紹 tiktoken:OpenAI開發的專業"分詞器" torch:Facebook開發的強力計算引擎,相當于超級計算器 理解詞嵌入:給詞語畫"…

【HarmonyOS 5.0】開發實戰:從UI到Native全解析

一、環境搭建與項目創建 ??跨平臺安裝?? DevEco Studio支持Windows/macOS系統,安裝包集成HarmonyOS SDK、Node.js和OHPM工具鏈。 Windows:雙擊.exe選擇非中文路徑macOS:拖拽.app至Applications目錄驗證:通過Help > Diagnos…

零知開源——STM32F103RBT6驅動 ICM20948 九軸傳感器及 vofa + 上位機可視化教程

STM32F1 本教程使用零知標準板(STM32F103RBT6)通過I2C驅動ICM20948九軸傳感器,實現姿態解算,并通過串口將數據實時發送至VOFA上位機進行3D可視化。代碼基于開源庫修改優化,適合嵌入式及物聯網開發者。在基礎驅動上新增…

華為OD最新機試真題-食堂供餐-OD統一考試(B卷)

題目描述 某公司員工食堂以盒飯方式供餐。 為將員工取餐排隊時間降低為0,食堂的供餐速度必須要足夠快,現在需要根據以往員工取餐的統計信息,計算出一個剛好能達成排隊時間為0的最低供餐速度。即,食堂在每個單位時間內必須至少做出 多少價盒飯才能滿足要求。 輸入描述 第1行…

【筆記】MSYS2 的 MINGW64 環境 全面工具鏈

#工作記錄 MSYS2 的 MINGW64 環境(mingw64.exe),下面是為該環境準備的最全工具鏈安裝命令(包括 C/C、Python、pip/wheel、GTK3/GTK4、PyGObject、Cairo、SDL2 等)。 這一環境適用于構建原生 64 位 Windows 應用程序。…

基于 HTTP 的單向流式通信協議SSE詳解

SSE(Server-Sent Events)詳解 🧠 什么是 SSE? SSE(Server-Sent Events) 是 HTML5 標準中定義的一種通信機制,它允許服務器主動將事件推送給客戶端(瀏覽器)。與傳統的 H…

【react+antd+vite】優雅的引入svg和阿里巴巴圖標

1.安裝相關包 由于是vite項目,要安裝插件來幫助svg文件引入進來,否則會失敗 npm下載包 npm i vite-plugin-svgr vite.config.ts文件內: import svgr from "vite-plugin-svgr"; //... export default defineConfig({plugins: …

UI框架-通知組件

UI框架-通知組件 介紹 一個基于 Vue 3 的輕量級通知組件庫,提供了豐富的消息通知功能。支持多種通知類型、自定義樣式、進度條顯示等特性。 特性 🎨 支持多種通知類型:信息、成功、警告、錯誤? 支持進度條顯示🔄 支持加載中狀…

WordZero:讓Markdown與Word文檔自由轉換的Golang利器

在日常工作中,我們經常需要在Markdown和Word文檔之間進行轉換。Markdown方便編寫和版本控制,而Word文檔更適合正式的商務環境。作為一名Golang開發者,我開發了WordZero這個庫,專門解決這個痛點。 項目背景 GitHub倉庫&#xff1…

計算機網絡面試匯總(完整版)

基礎 1.說下計算機網絡體系結構 計算機網絡體系結構,一般有三種:OSI 七層模型、TCP/IP 四層模型、五層結構。 簡單說,OSI是一個理論上的網絡通信模型,TCP/IP是實際上的網絡通信模型,五層結構就是為了介紹網絡原理而折…

動端React表格組件:支持合并

前言 在移動端開發中,表格組件是一個常見但復雜的需求。相比PC端,移動端表格面臨著屏幕空間有限、交互方式不同、性能要求更高等挑戰。本文將詳細介紹如何從零開始構建一個功能完整的移動端React表格組件,包含固定列、智能單元格合并、排序等…

廣告系統中后鏈路數據為什么要使用流批一體技術?流批一體技術是什么?

在大規模廣告系統的后鏈路(離線和實時特征計算、模型訓練與上線、效果監控等)中,往往既有對海量歷史數據的批量計算需求(離線特征、離線模型訓練、報表匯總),又有對在線請求的低延遲實時計算需求(實時特征、在線打分、實時監控/告警)。傳統將二者割裂、用 Lambda 架構…

6.10 - 常用 SQL 語句以及知識點

MySQL 技術 SQL 是結構化查詢語言,他是關系型數據庫的通用語言 SQL 可以分為分為以下三個類別 DDL (data definition languages) 語句 數據定義語言,定義了 不同的數據庫、表、索引等數據庫對象的定義。常用的的語句關鍵字包括 **create、drop、alter …

OpenCV CUDA 模塊光流計算------稀疏光流算法類SparsePyrLKOpticalFlow

操作系統:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 編程語言:C11 算法描述 OpenCV CUDA 模塊中實現的稀疏光流算法類,基于 Lucas-Kanade 方法,并支持圖像金字塔結構。適用于特征點跟蹤任務&#xf…

免費工具-微軟Bing Video Creator

目錄 引言 一、揭秘Bing Video Creator 二、輕松上手:三步玩轉Bing Video Creator 2.1 獲取與訪問: 2.2 創作流程: 2.3 提示詞撰寫技巧——釋放AI的想象力: 三、核心特性詳解:靈活滿足多樣化需求 3.1 雙重使用模…

MySQL技術內幕1:內容介紹+MySQL編譯使用介紹

文章目錄 1.整體內容介紹2.下載編譯流程2.1 安裝編譯工具和依賴庫2.2 下載編譯 3.配置MySQL3.1 數據庫初始化3.2 編輯配置文件3.3 啟動停止MySQL3.4 登錄并修改密碼 1.整體內容介紹 MySQL技術系列文章將從MySQL下載編譯,使用到MySQL各組件使用原理源碼分析&#xf…

MySQL 事務詳解

MySQL 事務詳解 一、事務是什么?為什么需要事務? 二、事務的四大特性(ACID)舉例說明:轉賬操作 三、MySQL 中事務的支持四、事務分類:隱式 vs 顯式1. 隱式事務(自動提交)2. 顯式事務&…

深入淺出Asp.Net Core MVC應用開發系列-AspNetCore中的日志記錄

ASP.NET Core 是一個跨平臺的開源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 應用。 ASP.NET Core 中的日志記錄 .NET 通過 ILogger API 支持高性能結構化日志記錄,以幫助監視應用程序行為和診斷問題。 可以通過配置不同的記錄提供程…