分布式搜索ElasticSearch-ES（一）

分布式搜索ElasticSearch-ES（一）

news/2025/9/18 6:28:32/文章來源:https://blog.csdn.net/ke1ying/article/details/132197446

一、ElasticSearch介紹

ES是一款非常強大的開源搜索引擎，可以幫我們從海量的數據中快速找到我們需要的內容。

ElasticSearch結合kibana、Logstash、Beats，也就是elastic stack(ELK)，被廣泛運用在日志數據分析，實時監控等領域。

ES負責數據 存儲、計算、搜索數據。

LogStash和Beats負責 數據抓取。

Kibana 是數據可視化組件。

Lucence是ES的底層開發，java語言搜索引擎類庫，是Apache公司頂級項目。

Lucence優勢：

易擴展。
高性能。（基于倒排索引）

缺點：

只限于java語言開發。
學習難度高，曲線陡峭。
不支持水平擴展。

于是在lucence的基礎上，ES優點：

支持分布式，可水平擴展。
提供restful接口，被任何語言調用。

什么是ElasticSearch？

一個開源的分布式搜索引擎，可以實現日志搜索，日志統計，分析等。

什么是ElasticSearch Stack(ELK)？

是以es為核心，logStash和beats負責數據抓取，kibana數據可視化的技術棧。

二、索引

傳統數據庫采用正向索引，而es采用倒排索引。

如mysql采用正向索引，比如一個表里有id，這個自增id就屬于主鍵索引，也屬于正向索引，查詢非常快。

但如果查詢某個字段，這個字段叫title其中存儲著“明朝那些事”，這時候如果想查包含“那些”的title怎么查詢呢，即使title有索引，這時候用模糊查詢也會索引失效。

?

ElasticSearch采用倒排索引，倒排索引有兩個概念，文檔和詞條。

文檔（document）：每條數據就是一個文檔。
詞條（term）：文檔按照語義分成的詞語。

詞條的唯一性保證不會重復，對詞條創建索引。

查詢“華為手機”的過程：

先拆分這個搜索為詞條“華為”“手機”。
在倒排索引通過詞條創建的主鍵索引，快速找到“手機”對應id為1,2,“華為”對應id為2,3。
文檔id1,2,3可以查詢到對應的三條數據，通過聚簇索引快速查詢到結果集。

為什么叫倒排索引呢，因為平時數據庫我們是先通過id去找具體的值，而es的倒排索引我們通過次創建新的索引，所以先是去找值再找對應索引的具體值。

三、ES與mysql對比

文檔：

ElasticSearch是面向文檔存儲，可以是數據庫一條商品或者一個訂單信息。會被序列化成JSON格式存儲。

索引（index）：

會把類型相同的索引放在一起，比如商品索引，用戶索引，訂單索引等。

Mysql的table 對比與 es的索引index

索引就是文檔的集合，類似與數據庫的表。

mysql的row對比與es的document

Document是json風格，row是一條條數據。

Mysql擅長事務，數據庫一致性和安全。

Es擅長海量數據搜索和計算。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/34825.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/34825.shtml
英文地址，請注明出處：http://en.pswp.cn/news/34825.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

accumulate函數的簡單應用

accumulate函數的簡單應用

accumulate函數是C numeric庫中的一個函數，主要用來對指定范圍內元素求和，但也自行指定一些其他操作，如范圍內所有元素相乘、相除等。使用前需要引用頭文件： #include <numeric>函數共有四個參數，其中前三個為…

閱讀更多...

Ajax 筆記（二）—— Ajax 案例

Ajax 筆記（二）—— Ajax 案例

筆記目錄 2. Ajax 綜合案例2.1 案例一-圖書管理2.1.1 渲染列表2.1.2 新增圖書2.1.3 刪除圖書2.1.4 編輯圖書 2.2 案例二-背景圖的上傳和更換2.2.1 上傳2.2.2 更換 2.3 案例三-個人信息設置2.3.1 信息渲染2.3.2 頭像修改2.2.3 信息修改2.3.4 提示框 Ajax 筆記： Ajax…

閱讀更多...

React Native 列表組件基礎知識

React Native 列表組件基礎知識

ScrollView 組件 ScrollView組件是一個容器滾動組件，當容器超出指定寬高時就可以進行滾動交互。 ScrollView組件是一次性渲染所有的 React 子組件，這在性能上是比較差的，所以不建議當列表特別長的時候使用此組件。接下來列舉幾個常用的一…

閱讀更多...

HTML（JavaEE初級系列12）

HTML（JavaEE初級系列12）

目錄前言： 1.HTML結構 1.1認識HTML標簽 1.2HTML文件基本結構 1.3標簽層次結構 1.4快速生成代碼框架 2.HTML常見標簽 2.1注釋標簽 2.2標題標簽：h1-h6 2.3段落標簽：p 2.4換行標簽： br 2.5格式化標簽 2.6圖片標簽&#…

閱讀更多...

【數據結構?堆】經典問題：k路歸并

【數據結構?堆】經典問題：k路歸并

題目描述 k路歸并問題： 　　把k個有序表合并成一個有序表。（ k < 10^4 ） 輸入輸出格式輸入格式： 輸入數據共有 2*k1 行。　　第一行，一個整數k（ k < 10^4 ），表示有k個有序…

閱讀更多...

【詳細教程】學會使用Python隧道代理

【詳細教程】學會使用Python隧道代理

作為一名專業爬蟲程序猿，我深知在進行網絡數據采集時，可能會面臨網絡封鎖、隱私泄露等問題。今天，我將與大家分享如何學會使用Python隧道代理，幫助我們自由訪問受限網站，同時保護了解探索Python隧道代理！ …

閱讀更多...

3.1 Spring MVC概述

3.1 Spring MVC概述

1. MVC概念 MVC是一種編程思想，它將應用分為模型（Model）、視圖（View）、控制器（Controller）三個層次，這三部分以最低的耦合進行協同工作，從而提高應用的可擴展性及可維護…

閱讀更多...

C++ opencv：視頻讀取、變換顏色風格、保存

C++ opencv：視頻讀取、變換顏色風格、保存

1. 相關知識點 VideoCapture； applyColorMap； VideoWriter； 2. 代碼編寫代碼main.cpp: #include<iostream> #include "opencv2/opencv.hpp" #include "opencv2/imgproc.hpp" #include "opencv2/highgu…

閱讀更多...

解開謎團：為什么紅黑樹勝過AVL樹？

解開謎團：為什么紅黑樹勝過AVL樹？

為什么紅黑樹勝過AVL樹博主簡介一、引言1.1、紅黑樹和AVL樹簡介1.2、紅黑樹在某些方面優于AVL樹二、紅黑樹和AVL樹的基本原理2.1、紅黑樹的定義和性質2.2、AVL樹的定義和性質2.3、對比兩種樹結構的特點三、插入和刪除操作的復雜性比較3.1、紅黑樹的插入操作和平衡性維護3.2、…

閱讀更多...

冪次方(c++題解)

冪次方(c++題解)

題目描述任何一個正整數都可以用 22 的冪次方表示。例如 1372^72^32^0。同時約定方次用括號來表示，即 a^b 可表示為 a(b)。由此可知，137137 可表示為 2(7)2(3)2(0) 進一步： 7 2^222^0 ( 2^121 用 2 表示)，并且 322^0。所…

閱讀更多...

Spring Boot 重啟命令

Spring Boot 重啟命令

Spring Boot 重啟命令本文描述了一個重啟Spring Boot命令執行過程和示例本文利用kill -9 關閉進程，不優雅，會突然中斷程序，可能導致數據和邏輯異常搜索微信小程序【亞特技術】在資源中搜索【優雅】可得到Spring Boot如何優化重啟 1. 過…

閱讀更多...

【Bert101】變壓器模型背后的復雜數學【02/4】

【Bert101】變壓器模型背后的復雜數學【02/4】

一、說明眾所周知，變壓器架構是自然語言處理（NLP）領域的突破。它克服了 seq-to-seq 模型（如 RNN 等）無法捕獲文本中的長期依賴性的局限性。變壓器架構被證明是革命性架構（如 BERT、GPT 和 T5 及其變體&…

閱讀更多...

【陣列信號處理】空間匹配濾波器、錐形/非錐形最佳波束成形器、樣本矩陣反演（SMI）研究（Matlab代碼實現）

【陣列信號處理】空間匹配濾波器、錐形/非錐形最佳波束成形器、樣本矩陣反演（SMI）研究（Matlab代碼實現）

💥💥💞💞歡迎來到本博客????💥💥 🏆博主優勢：🌞🌞🌞博客內容盡量做到思維縝密，邏輯清晰，為了方便讀者。 ??座右銘&a…

閱讀更多...

九耶丨閣瑞鈦倫特-產品經理面試題

九耶丨閣瑞鈦倫特-產品經理面試題

在產品上線后，會著重觀察6類指標： 1、活躍用戶指標衡量APP用戶規模的指標，一個產品是否成功，如果只看一個指標，那么這個指標一定是活躍用戶數。日活(DAU)：一天內日均活躍設備數(去重，每個公…

閱讀更多...

關于使用pycharm遇到只能使用unittest方式運行，無法直接選擇Run

關于使用pycharm遇到只能使用unittest方式運行，無法直接選擇Run

相信大家可能都遇到過這個問題，使用pycharm直接運行腳本的時候，只能選擇unittest的方式，能愁死個人經過幾次各種嘗試無果之后，博主就放棄死磕了，原諒博主是個菜鳥后來遇到這樣的問題，往往也就直接使用cm…

閱讀更多...

Python爬蟲-抓取的目標數據為#x開頭，怎么解決？

Python爬蟲-抓取的目標數據為#x開頭，怎么解決？

前言本文是該專欄的第4篇，后面會持續分享python爬蟲案例干貨，記得關注。在做爬蟲項目的時候，有時候抓取的平臺目標數據為&#x開頭，如下圖所示：瀏覽器顯示的正常數據，但通過爬蟲協議獲取到的網頁源碼數據卻是以&#x開頭的隱藏數據，遇到這種情況，爬蟲需要怎么處…

閱讀更多...

【Linux從入門到精通】文件I/O操作（C語言vs系統調用）

【Linux從入門到精通】文件I/O操作（C語言vs系統調用）

文章目錄一、C語言的文件IO相關函數操作 1、1 fopen與fclose 1、2 fwrite 1、3 fprintf與fscanf 1、4 fgets與fputs 二、系統調用相關接口 2、1 open與close 2、2 write和read 三、簡易模擬實現cat指令四、總結 🙋?♂? 作者：Ggggggtm 🙋?…

閱讀更多...

Golang bitset 基本使用

Golang bitset 基本使用

安裝： go get github.com/bits-and-blooms/bitset下面代碼把fmtx換成fmt就行 //------------基本操作------------//構建一個64bit長度的bitsetb : bitset.New(64)//放入一個數b.Set(10)fmtx.Println("add-10：", b.DumpAsBits()) // 0000000…

閱讀更多...

針對英特爾酷睿 CPU 優化，Canonical 發布 Ubuntu 實時內核

針對英特爾酷睿 CPU 優化，Canonical 發布 Ubuntu 實時內核

導讀Canonical 今天宣布針對支持時序協調運算（TCC）和時間敏感網絡（IEEE TSN）的英特爾酷睿處理器，推出優化版實時 Ubuntu 內核。 Canonical 于今年 2 月宣布，為購買 Ubuntu Pro 訂閱，使用代號為 …

閱讀更多...

OPENCV C++(七)霍夫線檢測+找出輪廓和外接矩形+改進旋轉

OPENCV C++(七)霍夫線檢測+找出輪廓和外接矩形+改進旋轉

霍夫線檢測 vector<Vec2f> lines1;HoughLines(canny_mat, lines1, 1, CV_PI / 180.0,90 );//45可以檢測里面兩條線 80檢測出外邊兩條線定義存放輸出線的向量此向量輸出有<距離，角度> 因為檢測的原理就是在變換霍夫空間里面去檢測的，這里可…

閱讀更多...

最新文章