分布式搜索——ElasticSeach簡介

一般都用數據庫存儲數據,然后對數據庫進行查詢獲取數據,但是當數據量很大時,查詢效率就會很慢(具體下面會講到),所以這種情況下就會使用到ElasticSeach

ElasticSeach的基本介紹

ElasticSeach是一 款非常強大的開源搜索引擎技術 ,可以幫助我們從海量數據中快速找到需要的內容?

在日常生活中,有很多會用到ElasticSeach的場景,比如網購時在輸入框輸入關鍵字搜索出來的商品、百度問的問題、訂外賣時搜吃的……類似這種在海量數據中搜索查詢指定數據的場景,都會用到ElasticSeach

elasticsearch 結合??kibana 、 Logstash 、 Beats,組件,統稱為?elastic stack (ELK) ,其實就是elasticsearch的技術棧。被廣泛應用在日志數據分析 、 實時監控等領域

還有其他的搜索引擎技術,不過elasticsearch目前應該是最好用的

正向索引和倒排索引

正向索引

倒排索引?

?ElasticSeach中的一些基本概念

文檔

索引和映射

數據庫和ElasticSeach對比

利用DSL語句操作ES

?在kibana上通過發送請求進行增刪改查操作,關于安裝請自行百度,或者參考:elasticsearch和kibana的安裝

kibana客戶端如下圖

索引庫的增刪改查操作

ES中的索引庫,指的就是索引,對應為數據庫中表的概念。我們要向數據表中存儲數據,首先應該創建表,在創建表時會對表做一些約束,如表中各字段的類型、是否不為空等等。相應的,我們要把文檔(前面說過文檔類似于表中的一行數據)存儲到索引庫中,就要先創建索引,同樣在創建索引時會對索引做一些約束。

創建好一個帶有指定約束的索引A后,這些約束就會在創建文檔并把文檔存入索引A時起作用,這個過程就叫mapping映射。還是以數據表舉例,一個用戶表有姓名和年齡兩個字段,類型分別為字符串和整形,那么往這個用戶表存一條用戶數據時,就會校驗這條用戶數據是否符合用戶表的約束,符合的話就是用戶數據和用戶表的約束是一一映射的(希望我能解釋清楚映射的意思,因為我自己一開始不太懂這個概念)。文檔和索引的處理過程和用戶數據用戶表的處理過程很像

mapping映射

創建索引庫

刪除、查看索引庫

修改索引庫

文檔增刪改查操作

新增文檔

查看、刪除文檔

修改文檔

利用RestClient操作ES

RestClient簡介

操作索引庫

具體操作看視頻吧,因為是案例不好做筆記,視頻里是基于Java語言的操作

?restclient操作ES

操作文檔

一樣,看視頻:?操作文檔

elasticsearch查詢文檔

用DSL查詢

query查詢分類

查詢所有?

精確查詢?

?gte表示大于等于,lte表示小于等于,gt表示大于,lt表示小于

?地理查詢

方法一,適合地圖找房之類的需求?

方法二,適合我的附近這種需求,其中我的就是中心點的位置,附近就是看設置的距離值?

復合查詢

function_score 在原始查詢結果的基礎上,人為干預搜索結果的排名,即決定哪些文檔比較靠前,哪些比較靠后

視頻?function_score

?

?布爾查詢

視頻??布爾查詢

搜索結果處理

排序

?例子1

例子2:

?

分頁

分頁默認只能查前10000條數據:具體看視頻:分頁查詢上限

高亮

具體的視頻:高亮的用法

對應的RestClient操作參考視頻,視頻是Java版本的:視頻教程

數據聚合

聚合的分類

DSL實現聚合

桶聚合

metrics聚合

自動補全

自動補全就是當我們在搜索引擎或者購物網站的搜索框中輸入一個詞時,出現的提示,一般通過分詞器實現

拼音分詞器

自定義分詞器

?

?

?實現自動補全

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/12735.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/12735.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/12735.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2024重慶高等教育博覽會|2024重慶高教展|全國高等教育博覽會

2024重慶高等教育博覽會|2024重慶高教展|全國高等教育博覽會 第62屆全國高等教育博覽會(2024.秋季重慶) 時間:2024年11月15-17日 地點:重慶國際博覽中心 組織機構 主辦單位:中國高等教育學會 承辦單位:國藥…

杰發科技AC7801——ADC之Bandgap和內部溫度計算

0. 參考 電流模架構Bandgap設計與仿真 bandgap的理解(內部帶隙電壓基準) ? ? 雖然看不懂這些公式,但是比較重要的一句應該是這個:因為傳統帶隙基準的輸出值為1.2V ? 1. 使用 參考示例代碼。 40002000是falsh控制器寄…

NXP RT1176(一)——二級BootLoader開發(安全引導加載程序SBL)

目錄 1. 開發環境 2. 二級BOOT的功能 3. 步驟 3.1 配置源碼 3.2 構建項目 3.2.1 MDK 3.2.2 IAR(IAR也編譯一下工程看看,這樣兩個平臺都可以支持了) 單核M7的開發!! 1. 開發環境 本文Windows下開發:…

【無標題】vo dto

在Java中,VO、PO、DTO都是常用的數據對象模型。 VO(Value Object)是值對象,通常用于表示一個業務實體或者頁面展示的內容。VO通常包含了多個屬性,并且這些屬性的類型和名稱與業務相關。VO并不一定與數據庫中的表結構相…

MHD、MQA、GQA注意力機制詳解

MHD、MQA、GQA注意力機制詳解 注意力機制詳解及代碼前言:MHAMQAGQA 注意力機制詳解及代碼 前言: 自回歸解碼器推理是 Transformer 模型的 一個嚴重瓶頸,因為在每個解碼步驟中加 載解碼器權重以及所有注意鍵和值會產生 內存帶寬開銷 下圖為三…

鞏固學習8

在 Pandas 中,sep參數用于指定數據中字段之間的分隔符。常見的參數包括: 逗號:,,常用于CSV文件。 制表符:\t,常用于TSV文件。 空格:’ ,用于空格分隔的數據。 分號:;&…

【合成孔徑雷達】合成孔徑雷達的多視角理解和時/頻成像算法的統一解釋

文章目錄 一、什么是雷達成像(1)主要的遙感探測手段:光學、紅外和雷達(2)從數學的角度:雷達成像主要研究什么?數據采集: y T x n yTxn yTxn信息提取: y ? > x ? y…

編譯錯誤:stray ‘\357’ in program的解決方法

目錄 把報錯文件更換編碼格式,我試的utf-8 bom編碼就可以了,可以多換幾種試試。 網友的另一種案例: 編譯錯誤:stray ‘\357’ in program的解決方法 把報錯文件更換編碼格式,我試的utf-8 bom編碼就可以了&#xff0c…

LabVIEW做儀器測試不知道是否適用

LabVIEW(Laboratory Virtual Instrument Engineering Workbench)是一個用于系統工程和測量系統的圖形編程平臺,由National Instruments開發。它非常適用于儀器控制、數據采集、信號處理以及自動化測試與測量系統的開發。如果您的工作涉及到這…

如何同步管理1000個設備的VLAN數據?

什么是VLAN? VLAN,也就是虛擬局域網,是通過為子網提供數據鏈路連接來抽象出局域網的概念。在企業網中,一個企業級交換機一般是24口或者是48口,連接這些接口的終端在物理上形成一個廣播域。廣播域過大,就會導…

【AI智能體】零代碼構建AI應用,全網都在喊話歌手誰能應戰,一鍵AI制作歌手信息查詢應用

歡迎來到《小5講堂》 這是《文心智能體平臺》系列文章,每篇文章將以博主理解的角度展開講解。 溫馨提示:博主能力有限,理解水平有限,若有不對之處望指正! 目錄 文心智能體大賽背景創建應用平臺地址快速構建【基礎配置】…

前端無樣式id或者class等來定位標簽

目錄: 1、使用背景2、代碼處理 1、使用背景 客戶使用我們產品組件,發現替換文件,每次替換都會新增如下的樣式,造就樣式錯亂,是組件的文件,目前臨時處理的話就是替換文件時刪除新增的樣式,但是發…

8評分卡建模整體流程梳理

評分卡建模整體流程梳理 學習目標 掌握評分卡建模流程使用Toad庫構建評分卡1 加載數據 import pandas as pd from sklearn.metrics import roc_auc_score,roc_curve,auc from sklearn.model_selection import train_test_split from sklearn.linear_model import Logis…

云服務器上Redis數據庫被攻擊實錄+總結

情景重現 Redis日志記錄(異常部分): 36346:M 14 May 2024 15:46:12.505 # Possible SECURITY ATTACK detected. It looks like somebody is sending POST or Host: commands to Redis. This is likely due to an attacker attempting to us…

【JVM】閱讀Class字節碼:常量池

目錄 基本結構解析 常量池 常量池簡介 如何閱讀Class文件中的常量池信息 基本結構解析 Magic(魔數) Magic的唯一作用是確定這個文件是否為一個能被虛擬機所接受的class 文件。魔數值固定為0xCAFEBABE,不會改變。 常量池 常量池簡介 下圖是反編譯過后的字節碼文…

Python可視化總結與案例解析

目錄 第一章:Python可視化基礎 1.1 環境搭建 1.2 數據可視化 1.3 統計圖表 1.4 交互式可視化 1.5 實戰案例:網站流量分析 1.6 總結 第二章:Python可視化高級應用 2.1 高級圖表類型 2.2 動態可視化 2.3 數據可視化最佳實踐 2.4 實戰…

TensorFlow的學習

0.基礎概念 術語表: https://developers.google.cn/machine-learning/glossary?hlzh-cn#logits 1.快速入門 https://tensorflow.google.cn/tutorials/quickstart/beginner?hlzh-cn 2.基于Keras進行圖像分類 https://tensorflow.google.cn/tutorials/keras/cl…

gradle 共享存儲掛載緩存目錄的問題

2個任務同時構建的時候,報錯如上。 原因:掛載目錄的問題導致的,掛在最小粒度的目錄下。 /home/app/.gradle/caches/modules-2/files-2.1 掛載到這個級別的目錄下。

一文詳解什么是手機在網時長API

手機在網時長API最近被討論得越來越多,因為隨著移動互聯網的不斷發展,越來越多的場景需要使用到用戶的手機號,比如商品交易、客戶服務、信息收發、網絡即時通訊等。手機號碼狀態查詢功能使用得越來越廣泛,常見的有手機在網時長查詢…

演員怎么上百度百科

百度百科是一個公正、開放、客觀的平臺,它為演員提供了一個展示自己過往經歷和演藝生涯的平臺。以下是百科優化網yajje總結的演員創建百度百科的一些步驟和注意事項: 創建演員百度百科的基本條件 人物影響力:演員創建百度百科需要滿足官方的規…