【Elasticsearch基礎】基本核心概念介紹

Elasticsearch作為當前最流行的分布式搜索和分析引擎，其強大的功能背后是一套精心設計的核心概念體系。本文將深入解析Elasticsearch的五大核心概念，幫助開發者構建堅實的技術基礎，并為高效使用ES提供理論支撐。

1 索引（Index）與文檔（Document）

在Elasticsearch中，索引(Index)*是最高層次的數據組織單位，相當于傳統數據庫中的"數據庫"概念。但與傳統數據庫不同，ES索引具有以下特點：

動態模式：字段類型可以在寫入時自動識別（可通過映射關閉）
分布式存儲：數據自動分布在集群的多個節點上
優化設計：專為搜索性能優化的數據結構

// 創建索引示例
PUT /test
{"settings": {"number_of_shards": 3,"number_of_replicas": 1}
}

// 查看索引 
GET /test

文檔(Document)：是ES中可被索引的最小數據單元，采用JSON格式表示：

每個文檔有唯一ID（可自動生成）
文檔包含多個字段（Field）
文檔元數據包括：_index,?_type,?_id,?_version等

// 插入文檔
POST /test/_doc/01
{"name": "智能手機","price": 3999,"description": "旗艦級配置","tags": ["電子","數碼"]
}

// 查看文檔 
GET /test/_doc/01

索引與傳統數據庫對比:

分片(Shard)：是Elasticsearch實現分布式特性的核心機制：

橫向擴展：索引被分成多個分片，分散在不同節點
容量限制：單個分片推薦不超過50GB數據（實際取決于硬件）
主分片(Primary)：負責處理索引和搜索請求
不可變性：分片數量在創建索引后不可更改

// 創建帶分片的索引
PUT /testindex
{"settings": {"number_of_shards": 3,"number_of_replicas": 1}
}

// 查看索引分片 
GET _cat/shards/testindex?v

副本(Replica)：是分片的拷貝，主要具備如下特性

數據冗余：防止硬件故障導致數據丟失
讀取擴展：搜索請求可以在所有副本上并行執行
故障轉移：當主分片不可用時，副本可提升為主分片

// 查看分片分配情況 
GET /_cat/shards/test?v

分片策略最佳實踐：

根據數據量預估總分片數（每分片30-50GB）
生產環境至少1個副本
分片數應與集群節點數協調（避免分配不均）

映射(Mapping)：定義了文檔及其字段的存儲和索引方式

字段數據類型：text, keyword, date, long等
索引控制：是否可搜索、是否存儲原始值
分析器指定：如何處理文本內容

// 基礎文本映射
PUT /test3
{"mappings": {"properties": {"title": { "type": "text" }, "views": { "type": "integer" },"publish_date": { "type": "date" }}}
}

Text：用于全文搜索，會被分詞
Keyword：用于精確匹配，如過濾、聚合

Geo_point：經緯度坐標
Nested：嵌套對象（保持數組元素間關系）
Join：定義父子文檔關系

允許一個字段以不同方式索引

"product_id": {"type": "keyword","fields": {"analyzed": { "type": "text" }}
}

深入理解Elasticsearch這些基礎核心概念，是構建高效搜索解決方案的基礎。在實際應用中，需要根據具體業務場景靈活組合這些特性。后續我們將深入探討查詢DSL、聚合分析等高級主題。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/75843.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/75843.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/75843.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！