Elasticsearch:15 年來致力于索引一切,找到重要內容

作者:來自 Elastic?Shay Banon?及?Philipp Krenn

Elasticsearch 剛剛 15 歲了!回顧過去 15 年的索引和搜索,并展望未來 15 年的相關內容。

Elasticsearch 剛剛成立 15 周年。一切始于 2010 年 2 月的一篇公告博客文章(帶有標志性的 “You Know, for Search - 你知道,用于搜索” 標語)、第一次公開提交和第一個版本,當時的版本號是 0.4.0。

讓我們回顧一下過去 15 年的索引和搜索,并展望未來 15 年的發展。

更多閱讀,請參閱:

  • Elasticsearch 簡介

  • Elasticsearch 的前世今生

GET _cat/stats

自推出以來,Elasticsearch 平均每秒被下載 3 次,累計下載量超過 14.5 億次。

GitHub 統計數據同樣令人印象深刻:來自 2,400 名獨特作者的超過 83,000 次提交、38,000 個問題、25,000 個分支和 71,500 個星標。并且沒有放緩的跡象。

所有這些都是建立在無數 Apache Lucene 貢獻之上的。今年是 Lucene 誕生 25 周年,我們也將深入討論這些問題。與此同時,你可以查看 20 周年紀念頁面,慶祝 Apache 的頂級項目之一。

Search 故事

亮點太多,無法全部列出,但以下是過去 15 年中推出的 15 個版本和功能,這些版本和功能使 Elasticsearch 達到了今天的水平:

  • Elasticsearch 公司(2012 年):該開源項目正式成為一家開源公司,為其成長奠定了基礎。
  • ELK Stack(2013 年):ElasticsearchLogstashKibana 聯手形成了 ELK Stack,現在它已成為日志記錄和分析的代名詞。
  • 版本 1(2014):第一個穩定版本引入了快照/恢復、聚合、斷路器和 _cat API 等主要功能。
  • Shield 和 Found(2015):Shield 以(付費)插件的形式為 Elasticsearch 集群帶來了安全性。而對 found.no 的收購則將 Elasticsearch 帶入了云端,發展成為現在的 Elastic Cloud。有趣的是,沒有人能找到 “Found”—— SEO對于某些關鍵詞來說可能很難。
  • 版本 2(2015):引入了 pipelined 聚合、使用 Java 安全管理器增強安全性以及提高性能和彈性。
  • 版本 5 和 Elastic Stack(2016):跳過兩個主要版本,統一 ELK Stack 的版本號,并在添加 Beats 后將其轉變為 Elastic Stack。此版本還引入了攝取節點和painless 腳本語言。
  • 版本 6(2017):帶來零停機升級、索引排序和類型刪除以簡化數據建模。
  • 版本 7(2019):將集群協調更改為更具可擴展性和彈性的 Zen2、單分片默認設置、內置 JDK 和自適應副本選擇。
  • 免費安全(2019):隨著 6.8 和 7.1 版本的發布,核心安全變得免費,以幫助每個人保護他們的集群。
  • ILM、數據層和可搜索快照(2020):通過索引生命周期管理 (ILM)、分層存儲和可搜索快照使時間序列數據更易于管理且更具成本效益。
  • 版本 8(2022):引入了使用 HNSW 的原生密集想量搜索,并默認啟用安全性。
  • ELSER(2023):推出了 Elastic Learned Sparse EncoderR 模型,帶來稀疏向量搜索以實現更好的語義相關性。
  • 再次開源(2024):添加 AGPL 作為許可選項以恢復開源 Elasticsearch。
  • Start Local(2024):運行 Elasticsearch 和 Kibana 變得比以往更容易:curl -fsSL https://elastic.co/start-local sh
  • LogsDB(2024):一種新的專門索引模式,可將日志存儲減少高達 65%。

搜索的未來一片光明

由于人工智能能力的崛起,搜索比以往更加相關且有趣。那么 Elasticsearch 的下一步是什么?由于內容太多,無法一一列舉,因此我們將重點討論三個領域及其所要解決的挑戰。

Serverless

沒有分片、節點或版本。 Elasticsearch Serverless(在 AWS 上已正式發布,在 Azure 上剛剛進入技術預覽版)可以解決你過去可能遇到的運營問題:

  • 15 年過去了,仍然有人無緣無故地將 number_of_shards 設置為 100。
  • 15 年了,我們仍在爭論 refresh_interval:1 秒還是 30 秒,就像這是一個生死攸關的決定一樣。
  • 15 年的大版本迭代、一次次的驚心動魄,以及升級到最新版本的刺激體驗。

你今天就可以試用 Elasticsearch Serverless。

ES|QL

“為 Elasticsearch 15 周年干杯 — — Query?DSL 仍然是你日常生活中最復雜的部分。” 但事實并非如此。新的 Elasticsearch 管道查詢語言 (ES|QL) 帶來了更簡單的語法,并對性能有更高要求的新計算引擎進行了重大投資。雖然我們正在構建更多功能,但你今天就可以使用 ES|QL。不用擔心; 查詢 DSL 將會理解。

人工智能無處不在

  • 經過 15 年的查詢調整,我們仍然只是使用 boost: 10 來解決問題。
  • 15 年來,我們一直致力于讓你的日志可搜索,但你仍然不知道生產過程中發生的情況。
  • 仍然最擅長找到那一條日志行...如果你還記得如何對其進行索引的話。

人工智能正在重新定義一切皆有可能 —— 從利用人工智能助手將原始日志轉化為可操作的見解以實現可觀察性和安全性,到利用語義理解和智能重新排名進行更相關的搜索。

這僅僅是一個開始。更多人工智能功能即將問世 —— 帶來更智能的搜索、增強的可觀察性和更強的安全性。 Elasticsearch 的未來不僅僅是查找數據;而是要理解它。敬請關注——最好的尚未到來。

感謝大家

感謝過去 15 年來的所有貢獻者、用戶和客戶,是他們讓 Elasticsearch 有了今天的地位。如果沒有你,我們就無法做到這一點,我們非常感謝你向 Elasticsearch 發送的每一個查詢。

展望未來 15 年。盡情享受吧!

Elasticsearch 包含許多新功能,可幫助你為你的用例構建最佳的搜索解決方案。深入了解我們的示例筆記本以了解更多信息,開始免費云試用,或立即在本地機器上試用 Elastic。

更多閱讀:與我們一起慶祝 Elasticsearch 15 周年

原文:Elasticsearch: 15 years of indexing it all, finding what matters - Elasticsearch Labs

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/70089.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/70089.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/70089.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

嵌入式軟件、系統、RTOS(高軟23)

系列文章目錄 4.2嵌入式軟件、系統、RTOS 文章目錄 系列文章目錄前言一、嵌入式軟件二、嵌入式系統三、嵌入式系統分類四、真題總結 前言 本節講明嵌入式相關知識,包括軟件、系統。 一、嵌入式軟件 二、嵌入式系統 三、嵌入式系統分類 四、真題 總結 就是高軟筆記…

數據結構 day02

3. 線性表 3.1. 順序表 3.1.3. 順序表編程實現 操作:增刪改查 .h 文件 #ifndef __SEQLIST_H__ #define __SEQLIST_H__ #define N 10 typedef struct seqlist {int data[N];int last; //代表數組中最后一個有效元素的下標 } seqlist_t;//1.創建一個空的順序表 seq…

數據恢復-01-機械硬盤的物理與邏輯結構

磁盤存儲原理 磁盤存儲數據的原理: 磁盤存儲數據的原理是利用磁性材料在磁場作用下的磁化性質,通過在磁盤表面上劃分成許多小區域,根據不同的磁化方向來表示0和1的二進制數據,通過讀寫磁頭在磁盤上的移動,可以實現數據…

wordpress get_footer();與wp_footer();的區別的關系

在WordPress中,get_footer() 和 wp_footer() 是兩個不同的函數,它們在主題開發中扮演著不同的角色,但都與頁面的“頁腳”部分有關。以下是它們的區別和關系: 1. get_footer() get_footer() 是一個用于加載頁腳模板的函數。它的主…

DeepSeek 通過 API 對接第三方客戶端 告別“服務器繁忙”

本文首發于只抄博客,歡迎點擊原文鏈接了解更多內容。 前言 上一期分享了如何在本地部署 DeepSeek R1 模型,但通過命令行運行的本地模型,問答的交互也要使用命令行,體驗并不是很好。這期分享幾個第三方客戶端,涵蓋了桌…

跟著李沐老師學習深度學習(十一)

經典的卷積神經網絡 在本次筆記中主要介紹一些經典的卷積神經網絡模型,主要包含以下: LeNet:最早發布的卷積神經網絡之一,目的是識別圖像中的手寫數字;AlexNet: 是第一個在大規模視覺競賽中擊敗傳統計算機…

使用JavaScript實現深淺拷貝

1. 拷貝的基本概念和必要性 在 JavaScript 中,數據類型分為基本數據類型(如 Number、String、Boolean、Null、Undefined、Symbol)和引用數據類型(如 Object、Array)。基本數據類型存儲的是值本身,而引用數…

解析瀏覽器中JavaScript與Native交互原理:以WebGPU為例

引言 隨著Web應用復雜度的提升,開發者對瀏覽器訪問本地硬件能力的需求日益增長。然而,瀏覽器必須在開放性與安全性之間找到平衡——既不能放任JavaScript(JS)隨意操作系統資源,又要為高性能計算、圖形渲染等場景提供支…

T-Sql 打印所有用戶表的建表腳本

-- 聲明一個變量用于存儲表名 DECLARE TableName NVARCHAR(128); -- 聲明一個游標,用于遍歷所有用戶表 DECLARE TableCursor CURSOR FOR SELECT name FROM sys.tables WHERE type U; -- 打開游標 OPEN TableCursor; -- 從游標中獲取第一行數據 FETCH NEXT FROM Ta…

25/2/16 <算法筆記> MiDas原理

MiDaS(Monocular Depth Sensing)是一種基于單目深度估計的技術,它通過深度學習方法使用單張RGB圖像(普通2D圖像)來估算場景的深度圖(Depth Map)。相比于傳統的依賴專用深度傳感器(如…

python+halcon 解讀labelme標注生成marksimage

這一段代碼封裝了一個類,需要傳統一個圖片和標注后json文件所在的地址,標注的選項是polygon,主要是用于unet深度學習網絡 在初始化時需要輸入文件(imagejeson)路徑,多分類任務的label_list。會在項目目錄下…

從技術債務到架構升級,滴滴國際化外賣的變革

背 景 商家營銷簡述 在外賣平臺的運營中,我們致力于通過靈活的補貼策略激勵商家,與商家共同打造良好的合作關系,也會提供多樣化的營銷活動,幫助商家吸引更多用戶下單。通過這些活動,不僅能夠提高商家的銷量&#xff0c…

英語—四級CET4考試—技巧篇—選詞填空—實操教學—2014 年 6 月大學英語四級考試真題(第 2 套)

🏠個人主頁:fo安方的博客? 💂個人簡歷:大家好,我是fo安方,目前中南大學MBA在讀,也考取過HCIE Cloud Computing、CCIE Security、PMP、CISP、RHCE、CCNP RS、PEST 3等證書。🐳 &…

線性代數中的正交和標準正交向量

在線性代數中,理解正交向量和正交向量至關重要,尤其是對于機器學習中的應用。這篇博文將簡化這些概念,而不會太深入地深入研究復雜的數學。 正交向量 如果兩個向量的點積等于零,則認為這兩個向量是正交的。但點積到底是什么呢&am…

企業文件共享中的權限管理與安全風險防范

在企業的日常運營中,文件共享是必不可少的一項工作。然而,文件共享過程中如果權限管理不當,極易引發安全風險,導致企業敏感信息泄露。因此,加強文件共享中的權限管理與安全風險防范,對于保障企業信息安全至…

急停信號的含義

前言: 大家好,我是上位機馬工,碩士畢業4年年入40萬,目前在一家自動化公司擔任軟件經理,從事C#上位機軟件開發8年以上!我們在開發C#的運動控制程序的時候,一個必要的步驟就是確認設備按鈕的急停…

數據結構:圖;鄰接矩陣和鄰接表

鄰接矩陣: 1.概念: 鄰接矩陣是圖的存儲結構之一,通過二維數組表示頂點間的連接關系。 2.具體例子 : 一.無向圖鄰接矩陣示例: 示例圖(頂點:A、B、C,邊:A-B、B-C&…

Kubernetes-master 組件

以下是Kubernetes Master Machine的組件。 etcd 它存儲集群中每個節點可以使用的配置信息。它是一個高可用性鍵值存儲,可以在多個節點之間分布。只有Kubernetes API服務器可以訪問它,因為它可能具有一些敏感信息。這是一個分布式鍵值存儲,所…

【第2章:神經網絡基礎與實現——2.1 前饋神經網絡的結構與工作原理】

老鐵們好!今天我們要來一場長達兩萬字的超詳細技術探險,我會像拆解樂高積木一樣把前饋神經網絡(Feedforward Neural Network)的每個零件擺在臺面上,用最接地氣的方式讓你徹底搞懂這個深度學習基石的工作原理。準備好了嗎?我們開始吧! 第一章:神經網絡的 “樂高積木” 1…

【云安全】云原生- K8S kubeconfig 文件泄露

什么是 kubeconfig 文件? kubeconfig 文件是 Kubernetes 的配置文件,用于存儲集群的訪問憑證、API Server 的地址和認證信息,允許用戶和 kubectl 等工具與 Kubernetes 集群進行交互。它通常包含多個集群的配置,支持通過上下文&am…