ElasticSearch 8.x 快速上手并了解核心概念

在新版Elasticsearch中，文檔document就是一行記錄(json)，而這些記錄存在于索引庫(index)中, 索引名稱必須是小寫
與關系型數據庫對比

index（索引）
- 在新版本中的Elasticsearh中，索引的概念等同于Mysql中表的概念，Elasticsearch中的索引可以直接存儲數據
document（文檔）
- 真正的數據，存儲一條數據就是一份文檔，存儲格式為JOSN，等同于mysql中的一條數據
shards（分片）
- 數據量特大，沒有足夠大的硬盤空間來一次性存儲，且一次性搜索那么多的數據，響應跟不上
- ES提供把數據進行分片存儲，這樣方便進行拓展和提高吞吐
replicas（副本）
- 分片的拷貝，當主分片不可用的時候，副本就充當主分片進行使用
- 索引分片的備份，shard和replica一般存儲在不同的節點上，用來提高可靠性
- 案例
  - 假如Elasticsearch中的每個索引分配5個主分片和1個副本
  - 如果集群中至少有兩個節點，索引將會有5個主分片和另外5個復制分片（1個完全拷貝）這樣每個索引總共有10個分片

GET /_cat/indices?v=true&pretty

GET /_cat/shards?v=true&pretty

PUT /<index_name>
{"settings": {"number_of_shards": 1,"number_of_replicas": 1}
}

HEAD /<index_name>

GET /<index_name>

PUT /<index_name>/_settings
{"settings": {"number_of_replicas": 2}
}

DELETE /<index_name>

PUT /my_index
{"mappings": {"properties": {"id": {"type": "keyword"},"title": {"type": "text"},"price": {"type": "float"}}}
}

GET /<index_name>/_mappingGET /my_index/_mapping

text字段類型
- text類型主要用于全文本搜索，適合存儲需要進行全文本分詞的文本內容，如文章、新聞等
- text字段會對文本內容進行分詞處理，將文本拆分成獨立的詞項（tokens）進行索引
- 分詞的結果會建立倒排索引，使搜索更加靈活和高效
- text字段在搜索時會根據分詞結果進行匹配，并計算相關性得分，以便返回最佳匹配的結果
keyword字段類型
- keyword類型主要用于精確匹配和聚合操作，適合存儲不需要分詞的精確值，如ID、標簽、關鍵字等
- keyword字段不會進行分詞處理，而是將整個字段作為一個整體進行索引和搜索
- 這使得搜索只能從精確的值進行匹配，而不能根據詞項對內容進行模糊檢索
- keyword字段適合用于過濾和精確匹配，同時可以進行快速的基于精確值的聚合操作
類型選擇
- 在選擇text字段類型和keyword字段類型時，需要根據具體的需求進行權衡和選擇
- 如果需要進行全文本檢索，并且希望根據分詞結果計算相關性得分，以獲得最佳的匹配結果，則選擇text字段類型
- 如果需要進行精確匹配、排序或聚合操作，并且不需要對內容進行分詞，則選擇keyword字段類型

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/81881.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/81881.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/81881.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！