Elasticsearch名詞解釋

文章目錄

      • 1.什么是Elasticsearch?
      • 2.什么是elastic stack(ELK)?
      • 3.什么是Lucene?
      • 4.什么是文檔(document)?
      • 5.什么是詞條(term)?
      • 6.什么是正向索引?
      • 7.什么是倒排索引?
      • 8.ES中的索引(index)
      • 9.映射(Mapping)
      • 10.DSL
      • 11.elastcisearch與mysql的關系(讀寫分離)
      • 12.Elasticsearch目錄介紹
      • 13.ES默認的兩個端口
      • 14.如何解決ES跨域問題
      • 15.Kibana默認端口和啟動文件
      • 16.Kibana漢化
      • 17.什么是IK分詞器?
      • 18.IK分詞器的兩種分詞算法
      • 19.IK分詞器擴展詞條,停用詞條
      • 20.ES的默認分詞器

基于Elasticsearch-7.15.1,需要安裝jdk8 或者jdk11支持

1.什么是Elasticsearch?

一個開源的分布式搜索引擎,通過Restful方式進行交互的近實時搜索平臺框架,可以用來實現搜索、日志統計、分析、系統監控等功能,

2.什么是elastic stack(ELK)?

是以elasticsearch為核心的技術棧,包括(beats,(L)Logstash)數據抓取,((K)kibana)數據可視化,((E)elasticsearch)存儲、計算、搜索數據

3.什么是Lucene?

java語言的搜索引擎類庫,提供了搜索引擎的核心API,elasticsearch就是基于Lucene開發的

4.什么是文檔(document)?

每一條數據就是文檔,相當于mysql中的一條記錄,但是ES中的文檔是json格式的,文檔中的字段成為Field,相當于mysql中的列Column

5.什么是詞條(term)?

對文檔中的內容進行分詞,得到的詞語就是詞條

6.什么是正向索引?

基于文檔id創建索引,查詢詞條的時候先找到文檔,后判斷文檔是否包含詞條

7.什么是倒排索引?

對文檔的內容進行分詞,對詞條創建索引,查詢時根據詞條查詢文檔id,而后獲得文檔

8.ES中的索引(index)

相同類型的文檔(json格式)集合,相當于mysql中的表(相同數據的集合)

9.映射(Mapping)

ES索引中文檔的約束

10.DSL

DSL是elasticsearch提供的json風格的請求語句,就是操作ES,實現增刪改查,相當于mysql中的sql語句

11.elastcisearch與mysql的關系(讀寫分離)

數據庫負責事務類型的操作,可以確保數據的原子性、一致性、隔離性、持久性

擅長海量數據的搜索、分析、計算(針對業務量大、搜索需求比較復雜)

12.Elasticsearch目錄介紹

bin/elasticsearch.bat:啟動文件

config/log4j2:日志配置文件

config/jvm.options:虛擬機相關的配置

config/elasticsearch.yml:ES的配置文件!默認端口!跨域!

lib:相關jar包

logs:日志目錄

modules:功能模塊目錄

data:數據目錄

plugins:插件目錄

13.ES默認的兩個端口

9200:客戶端使用

9300:集群內部通信

14.如何解決ES跨域問題

找到config/elasticsearch.yml文件

http.cors.enabled: true

http.cors.allow-origin: “*”# 也可以指定具體的允許來源

15.Kibana默認端口和啟動文件

5601

bin/kibana.bat

默認會指向9200從而操作ES

16.Kibana漢化

x-pack/plugins/translations/translations/zh-CN.json

修改:config/kibana.yml --> i18n.locale: “zh-CN”

17.什么是IK分詞器?

把一個一個中文劃分成一個一個的關鍵字,如果使用中文,建議使用IK分詞器,下載ik分詞器之后,在ES的plugins目錄解壓放入ik目錄,重啟即可

在bin目錄下打開命令行,執行elasticsearch-plugin list可以查看加載進來的插件

18.IK分詞器的兩種分詞算法

ik_smart:最少切分,粗粒度

ik_max_word:最細粒度切分

19.IK分詞器擴展詞條,停用詞條

當詞典沒有自己需要的詞的時候就可以自己添加詞語,例如"白嫖"

進入IK分詞器的config/IKAnalyzer.cfg.xml文件更改配置

my.dic

mystop.dic

my.dic、mystop.dic就是自己在config目錄下新建的詞條文件

20.ES的默認分詞器

standard分詞器:默認的分詞規則對中文處理并不友好

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64743.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64743.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64743.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網絡滲透測試實驗三:SQL注入

1.實驗目的和要求 實驗目的:了解SQL注入的基本原理;掌握PHP腳本訪問MySQL數據庫的基本方法;掌握程序設計中避免出現SQL注入漏洞的基本方法;掌握網站配置。 系統環境:Kali Linux 2、Windows Server 網絡環境:交換網絡結構 實驗工具: SqlMAP;DVWA 2.實驗步驟 實驗目…

SQL-Server鏈接服務器訪問Oracle數據

SQL Server 鏈接服務器訪問 Oracle 離線安裝 .NET Framework 3.5 方法一:使用 NetFx3.cab 文件 下載 NetFx3.cab 文件,并將其放置在 Windows 10 系統盤的 C:Windows 文件夾中。 以管理員身份運行命令提示符,輸入以下命令并回車: …

【R語言】校準曲線,繪制原理

①獲取predict的結果,“prob.Case”這一列就是預測風險概率,“truth”列為實際發生結局的分組 ②將prob.Case進行分桶(簡單理解為分組,一般分10組),常見的分桶方式有兩種:一是將prob.Case從大到小排序后&a…

QTDemo:串口調試工具

項目簡介 本項目通過QT框架設計一款可以在Windows、Linux等平臺的跨平臺串口助手,串口功能能夠滿足基本的調試需求。 本項目采用的版本為:QT5.14 visual studio 2022 進行開發。 項目源碼:https://github.com/say-Hai/MyCOMDemo 項目頁面&am…

基于SpringBoot和OAuth2,實現通過Github授權登錄應用

基于SpringBoot和OAuth2,實現通過Github授權登錄應用 文章目錄 基于SpringBoot和OAuth2,實現通過Github授權登錄應用0. 引言1. 創建Github應用2. 創建SpringBoot測試項目2.1 初始化項目2.2 設置配置文件信息2.3 創建Controller層2.4 創建Html頁面 3. 啟動…

CMS漏洞靶場攻略

DeDeCMS 環境搭建 傻瓜式安裝 漏洞一:通過文件管理器上傳WebShel 步驟?:訪問目標靶場其思路為 dedecms 后臺可以直接上傳任意文件,可以通過?件管理器上傳php文件獲取webshell 登陸網站后臺 步驟二:登陸到后臺點擊 【核心】 --》 【文件式…

0xc0000020錯誤代碼怎么處理,Windows11、10壞圖像錯誤0xc0000020的修復辦法

“0xc0000020”是一種 Windows 應用程序錯誤代碼,通常表明某些文件缺失或損壞。這可能是由于系統文件損壞、應用程序安裝或卸載問題、惡意軟件感染、有問題的 Windows 更新等原因導致的。 比如,當運行軟件時,可能會出現類似“C:\xx\xxx.dll …

LabVIEW 中 NI Vision 模塊的IMAQ Create VI

IMAQ Create VI 是 LabVIEW 中 NI Vision 模塊(NI Vision Development Module)的一個常用 VI,用于創建一個圖像變量。該圖像變量可以存儲和操作圖像數據,是圖像處理任務的基礎。 ? 通過以上操作,IMAQ Create VI 是構建…

HTML5 標簽輸入框(Tag Input)詳解

HTML5 標簽輸入框(Tag Input)詳解 標簽輸入框(Tag Input)是一種用戶界面元素,允許用戶輸入多個標簽或關鍵詞,通常用于表單、搜索框或內容分類等場景。以下是實現標簽輸入框的詳細講解。 1. 任務概述 標…

使用位操作符實現加減乘除!

歡迎拜訪:霧里看山-CSDN博客 本篇主題:使用位操作符實現加減乘除 發布時間:2025.1.1 隸屬專欄:C語言 目錄 位操作實現加法運算()原理代碼示例 位操作實現減法運算(-)原理代碼示例 位…

[Spring] Spring AOP

🌸個人主頁:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵?熱門專欄: 🧊 Java基本語法(97平均質量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection與…

Java-數據結構-時間和空間復雜度

一、什么是時間和空間復雜度? 📚 那么在了解時間復雜度和空間復雜度之前,我們先要知道為何有這兩者的概念: 首先我們要先了解"算法",在之前我們學習過關于"一維前綴和與差分","…

商湯C++開發面試題及參考答案

C++11 有哪些新特性? C++11 帶來了眾多令人矚目的新特性,極大地豐富和增強了這門編程語言的功能與表現力。 首先是類型推導方面,引入了auto關鍵字。通過auto,編譯器能夠自動根據初始化表達式來推導出變量的類型,這在處理復雜的模板類型或者較長的類型聲明時非常方便,能讓…

Cesium 實戰 27 - 三維視頻融合(視頻投影)

Cesium 實戰 27 - 三維視頻融合(視頻投影) 核心代碼完整代碼在線示例在 Cesium 中有幾種展示視頻的方式,比如墻體使用視頻材質,還有地面多邊形使用視頻材質,都可以實現視頻功能。 但是隨著攝像頭和無人機的流行,需要視頻和場景深度融合,簡單的實現方式則不能滿足需求。…

U盤格式化工具合集:6個免費的U盤格式化工具

在日常使用中,U盤可能會因為文件系統不兼容、數據損壞或使用需求發生改變而需要進行格式化。一個合適的格式化工具不僅可以清理存儲空間,還能解決部分存儲問題。本文為大家精選了6款免費的U盤格式化工具,并詳細介紹它們的功能、使用方法、優缺…

如何使用AI工具cursor(內置ChatGPT 4o+claude-3.5)

??溫馨提示: 禁止商業用途,請支持正版,充值使用,尊重知識產權! 免責聲明: 1、本教程僅用于學習和研究使用,不得用于商業或非法行為。 2、請遵守Cursor的服務條款以及相關法律法規。 3、本…

Spring Boot的開發工具(DevTools)模塊中的熱更新特性導致的問題

問題: java.lang.ClassCastException: class cn.best.scholarflow.framework.system.domain.entity.SysUser cannot be cast to class cn.best.scholarflow.framework.system.domain.entity.SysUser (cn.best.scholarflow.framework.system.domain.…

異常與中斷(上)

文章目錄 一、異常與中斷的概念引入與處理流程1.1 生活中的中斷1.2 母親如何處理中斷1.3 ARM系統中異常與中斷處理流程 二、ARM架構中異常與中斷的處理2.1 處理流程2.2 cortex M3/M42.2.1 M3/M4的向量表2.2.2 M3/M4的異常/中斷處理流程 2.3 cortex A72.3.1 A7的向量表2.3.2 A7的…

Zabbix 監控平臺 添加監控目標主機

Zabbix監控平臺是一個企業級開源解決方案,用于分布式系統監視和網絡監視。它由Zabbix Server和可選組件Zabbix Agent組成,通過C/S模式(客戶端-服務器模型)采集數據,并通過B/S模式(瀏覽器-服務器模型&#x…

游戲關卡設計的常用模式

游戲關卡分為很多種,但常用的有固定套路,分為若干種類型。 關卡是主角與怪物、敵方戰斗的場所,包括裝飾物、通道。 單人游戲的關卡較小,偏線性; 聯機/MMO的關卡較大,通道多,自由度高&#xf…