探索Doris:日志分析的新寵,是否能取代老牌ES?

在大數據時代,日志存儲與分析對于企業的運營和決策起著至關重要的作用。Elasticsearch(簡稱 ES)作為一款廣泛應用的開源分布式搜索和分析引擎,長期以來在日志管理領域占據著舉足輕重的地位。然而,隨著技術的不斷發展,新的解決方案層出不窮,其中Apache Doris 憑借其卓越特性,在日志存儲與分析領域迅速崛起,引發業界熱議:Doris 是否會成為新一代王者,取代傳統的 Elasticsearch(ES)?

1.ES在日志存儲與分析中的現狀

ES 憑借其強大的全文搜索功能、高擴展性和靈活的架構,成為了眾多企業處理日志數據的首選。它能夠快速索引海量日志,使得用戶可以通過簡單的查詢語句,在秒級甚至毫秒級內獲取到所需的日志信息。同時,ES 與 Kibana 等可視化工具的緊密集成,為用戶提供了直觀、便捷的日志分析界面,方便用戶進行數據探索、監控和告警。

例如,在互聯網公司的運維場景中,ES 可以收集來自各個服務器、應用程序的日志,運維人員通過 ES 的搜索功能,能夠迅速定位系統故障時的關鍵日志信息,從而快速解決問題,保障服務的穩定性。在金融行業,ES 用于分析交易日志,幫助金融機構監測異常交易行為,防范風險。

2.Doris的崛起與特點

Apache Doris 是一款基于 MPP(大規模并行處理)架構的高性能分析型數據庫。它專為海量數據分析場景設計,在日志存儲與分析方面展現出了諸多令人矚目的特點。

1.極速查詢性能

Doris 采用了向量化執行引擎和高效的存儲格式,能夠對大規模日志數據進行快速掃描和計算。在復雜查詢場景下,Doris 的性能優勢尤為明顯。例如,當需要對數十億條日志記錄進行多維度分析時,Doris 能夠在極短的時間內返回結果,相比傳統的數據庫和部分分析引擎,查詢速度提升了數倍甚至數十倍。這種極速的查詢性能,使得運維人員和數據分析人員能夠實時獲取日志分析結果,及時做出決策。

2.簡單易用

Doris 提供了標準的 SQL 接口,對于熟悉 SQL 語言的開發人員和數據分析師來說,幾乎沒有學習成本。用戶可以使用他們熟悉的 SQL 語法進行日志數據的查詢和分析,無需學習復雜的查詢語法和工具。同時,Doris 的部署和管理也相對簡單,降低了企業在技術運維方面的成本和難度。例如,企業只需按照簡單的安裝步驟,即可快速搭建起 Doris 集群,投入日志分析工作。

3.高擴展性

Doris 的分布式架構支持水平擴展,企業可以根據日志數據量的增長情況,靈活地添加節點來提升系統的存儲和計算能力。在面對日志數據量爆發式增長的情況下,Doris 能夠輕松應對,保障系統性能不受影響。而且,Doris 在擴展過程中,數據的均衡分布和負載均衡機制能夠自動完成,無需人工過多干預,大大提高了系統的可維護性。

3.Doris替換ES進行日志存儲與分析的優勢

1.成本效益

從硬件成本來看,ES 在處理大規模日志數據時,由于其索引結構和存儲方式的特點,往往需要較多的內存和磁盤空間來存儲索引數據。而 Doris 以其高效的存儲格式,能夠在相同的數據量下,占用更少的硬件資源,降低了企業的硬件采購成本。在運維成本方面,Doris 簡單易用的特性使得運維人員無需花費大量時間進行復雜的配置和維護工作,減少了人力成本的投入。

2.實時分析能力

日志數據的價值在于實時性,企業需要及時從日志中獲取有價值的信息,以便做出快速響應。Doris 的極速查詢性能使得它在實時分析日志數據方面表現出色。與 ES 相比,Doris 能夠更快地對新寫入的日志數據進行分析,為企業提供更及時的決策支持。例如,在電商促銷活動期間,企業可以通過 Doris 實時分析用戶行為日志,及時調整營銷策略,提高銷售轉化率。

3.數據融合與分析

在實際業務場景中,企業往往需要將日志數據與其他業務數據進行融合分析,以獲取更全面的洞察。Doris 作為一款分析型數據庫,能夠很好地與企業現有的數據倉庫、業務數據庫等進行集成,方便用戶在同一平臺上對多種類型的數據進行統一分析。而 ES 主要專注于日志搜索和簡單的分析,在數據融合方面相對較弱。

4.案例見證

騰訊音樂:存儲成本大瘦身,性能飆升

騰訊音樂擁有海量的音樂內容數據,原先采用 Elasticsearch 與 Doris 的混合架構,前者負責全文檢索和標簽圈選,后者專注 OLAP 分析。但隨著數據量增長,Elasticsearch 存儲空間占用大、寫入性能受限等問題凸顯,混合架構還導致維護成本增加與數據不一致風險。鑒于 Doris 自 2.0 版本起支持倒排索引和全文檢索,騰訊音樂將架構統一為 Doris。升級后效果立竿見影,存儲成本大幅降低 80%,如某表單日全量數據在 Elasticsearch 需 697.7GB 空間,在 Doris 僅需 195.4GB 。全量數據導入時間從超 10 小時縮至 3 小時內,寫入性能提升至 Elasticsearch 的 4 倍,還支持復雜自定義標簽計算,極大改善用戶體驗。

科大訊飛:查詢效率飛躍,成本顯著降低

科大訊飛的星跡日志中心,起初基于 Elasticsearch 搭建日志處理架構,隨著日志數據迅猛增長,CPU 占用高、存儲成本高、穩定性差等問題接踵而至。后來嘗試采用基于 Grafana Loki 的輕量化架構,依然存在 CPU 使用率高、查詢分析效率低等狀況。最終,科大訊飛引入 Apache Doris 作為可觀測性存儲底座。Doris 展現出強大實力,可支撐日均 600 億條、10TB 的寫入流量,與 Elasticsearch 相比,存儲成本降至其六分之一,查詢效率至少提升 10 倍,尤其是在聚合分析、短語模糊匹配及 topn 命中前綴索引等場景下表現卓越。借助 Doris Manager,集群管理變得便捷輕松,系統還提供 Grafana 和自研 web 查詢界面,方便用戶進行日志檢索與分析。

中信銀行:借 Doris 之力,打破 ES 日志處理困境

中信銀行信用卡中心每日新增日志達 140 億條、約 80TB,全量歸檔超 40PB。早期基于 Elasticsearch 的日志云平臺,在數據量激增時,存儲成本高、寫入慢、檢索緩,難滿足復雜業務需求。引入 Apache Doris 后,局面扭轉。Doris 每日穩定處理百 TB 級日志寫入,延遲 1 秒內,支持 PB 級存儲,較 ES 存儲成本降 60%-80%,還能將冷數據存至低成本介質。在日志檢索上,常見查詢可秒級響應,具備強大的檢索、聚合等分析能力。

5.結語

Apache Doris 憑借其在查詢性能、易用性、擴展性以及成本效益等方面的優勢,在日志存儲與分析領域展現出了強大的競爭力,為企業提供了一種替換 ES 的可行選擇。當然,ES 也在不斷發展和完善,在某些特定場景下仍然具有不可替代的價值。但無論如何,Doris 的出現為企業的日志管理帶來了新的思路和解決方案,促使我們重新審視和優化日志存儲與分析的架構。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/899853.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/899853.shtml
英文地址,請注明出處:http://en.pswp.cn/news/899853.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

學習threejs,使用Texture紋理貼圖,測試repeat重復紋理貼圖

👨??? 主頁: gis分享者 👨??? 感謝各位大佬 點贊👍 收藏? 留言📝 加關注?! 👨??? 收錄于專欄:threejs gis工程師 文章目錄 一、🍀前言1.1 ??Texture 紋理貼圖1.1.1 ??…

圖像配準及識別

一、圖像配準基礎 圖像配準,聽起來很高大上,其實用大白話來說,就是“讓兩張照片對齊”的技術。想象一下,你有兩張拍得不完全一樣的照片,比如一張是你從正面拍的風景,另一張是從側面拍的同一個地方&#xff…

QT之QML(簡單示例)

需求一:點擊按鈕彈出菜單,并且自定義菜單彈出位置。 mouse.x 和 mouse.y 獲取的是相對于 MouseArea(在這個例子中是 Button)左上角的局部坐標。如果你想要在鼠標點擊位置顯示 Menu,你需要將這個局部坐標轉換為相對于應…

如何編寫單元測試

一、前言知識 1.開發過程 需求分析->設計->開發->測試->上線 2.測試種類 單元測試(測試模塊編碼)、黑盒測試(測試功能是否滿足需求)、白盒測試(測試程序內部的邏輯結構)、回歸測試(提出的缺陷進行二次驗證)、集成測試(測試主要的業務功能及模塊間的整合性)、系…

LeetCode 解題思路 30(Hot 100)

解題思路: 遞歸參數: 生成括號的對數 n、結果集 result、當前路徑 path、左括號數 open、右括號數 close。遞歸過程: 當當前路徑 path 的長度等于 n * 2 時,說明已經生成有效括號,加入結果集。若左括號數小于 n&…

【Golang】Windows系統鍵鼠空閑監測練習

在本文中,我們將練習如何使用Golang編寫一個簡單的Windows系統空閑時間監測工具。該工具能夠檢測系統的空閑時間,并在達到一定閾值時計數。 功能概述 監控鼠標和鍵盤的空閑事件,每空閑超過50s,觸發次數加一。 該工具具有以下功…

關于React Redux

官網:👉詳情一 👉詳情二 👉關于redux 使用原因:👉詳情 /** 2-1、隨著javascript單頁應用程序的發展,需要在代碼中管理更多的狀態(包括服務器響應數據、緩存數據、本地創建還未發送…

MySQL和Oracle批量插入SQL差異詳解

文章目錄 MySQL和Oracle批量插入SQL差異詳解1. 基本批量插入語法1.1 MySQL批量插入1.2 Oracle批量插入 2. 帶序列的批量插入2.1 MySQL帶自增ID的批量插入2.2 Oracle帶序列的批量插入 3. 條件批量插入3.1 MySQL條件批量插入3.2 Oracle條件批量插入 MySQL和Oracle批量插入SQL差異…

43頁可編輯PPT | 大數據管理中心設計規劃方案大數據中心組織架構大數據組織管理

這份文檔是一份關于大數據管理中心規劃設計方案的詳細報告,涵蓋了背景與需求分析、整體規劃方案、關鍵能力實現方案以及實施方案等內容。報告強調大數據在城市治理中的重要性,提出通過構建統一的大數據平臺,整合城市各部門數據資源&#xff0…

Python-八股總結

目錄 1 python 垃圾處理機制2 yield3 python 多繼承,兩個父類有同名方法怎么辦?4 python 多線程/多進程/協程4.1 多線程與GIL全局解釋器鎖4.2 多進程4.3 協程 5 樂觀鎖/悲觀鎖6 基本數據結構**1. 列表(List)****2. 元組&#xff0…

HTML 標簽類型全面介紹

HTML 標簽類型全面介紹 HTML(HyperText Markup Language)是構建 Web 頁面結構的基礎語言。HTML 由不同類型的標簽組成,每種標簽都有特定的用途。本文將全面介紹 HTML 標簽的分類及其用法。 1. HTML 標簽概述 HTML 標簽通常成對出現&#xf…

vscode中的【粘滯滾動】的基本概念和作用,關閉了以后如何開啟

1、粘滯滾動的基本概念和作用 ?VSCode中的“粘滯”功能主要是指編輯器在滾動時的一種特殊效果,使得編輯器在滾動到某個位置時會“粘”在那里,而不是平滑滾動到底部或頂部。? 粘滯滾動的基本概念和作用 粘滯滾動功能可以讓用戶在滾動時更直觀地看到當前…

【商城實戰(101)】電商未來已來:新技術引領商城發展新航向

【商城實戰】專欄重磅來襲!這是一份專為開發者與電商從業者打造的超詳細指南。從項目基礎搭建,運用 uniapp、Element Plus、SpringBoot 搭建商城框架,到用戶、商品、訂單等核心模塊開發,再到性能優化、安全加固、多端適配,乃至運營推廣策略,102 章內容層層遞進。無論是想…

深度學習Note.5(機器學習.6)

1.Runner類 一個任務應用機器學習方法流程: 數據集構建 模型構建 損失函數定義 優化器 模型訓練 模型評價 模型預測 所以根據以上,我們把機器學習模型基本要素封裝成一個Runner類(加上模型保存、模型加載等功能。) Runne…

linux服務器專題1------redis的安裝及簡單配置

在 linux上安裝 Redis 可以按照以下步驟進行(此處用Ubuntu 服務器進行講解): 步驟 1: 更新系統包 打開終端并運行以下命令以確保你的系統是最新的: sudo apt update sudo apt upgrade步驟 2: 安裝 Redis 使用 apt 包管理器安裝 Redis: s…

面試問題總結:qt工程師/c++工程師

C 語言相關問題答案 面試問題總結:qt工程師/c工程師 C 語言相關問題答案 目錄基礎語法與特性內存管理預處理與編譯 C 相關問題答案面向對象編程模板與泛型編程STL 標準模板庫 Qt 相關問題答案Qt 基礎與信號槽機制Qt 界面設計與布局管理Qt 多線程與并發編程 目錄 基礎…

實現實時數據推送:SpringBoot中SSE接口的兩種方法

🌟 前言 歡迎來到我的技術小宇宙!🌌 這里不僅是我記錄技術點滴的后花園,也是我分享學習心得和項目經驗的樂園。📚 無論你是技術小白還是資深大牛,這里總有一些內容能觸動你的好奇心。🔍 &#x…

LXC 導入多Linux系統

前提要求 ubuntu下安裝lxd 參考Rockylinux下安裝lxd 參考LXC 源替換參考LXC 容器端口發布參考LXC webui 管理<

ES的文檔更新機制

想獲取更多高質量的Java技術文章&#xff1f;歡迎訪問Java技術小館官網&#xff0c;持續更新優質內容&#xff0c;助力技術成長 Java技術小館官網https://www.yuque.com/jtostring ES的文檔更新機制 在現代應用中&#xff0c;數據的動態性越來越強&#xff0c;我們不僅需要快…

trae.ai 編輯器:前端開發者的智能效率革命

一、為什么我們需要更智能的編輯器&#xff1f; 作為從業5年的前端開發者&#xff0c;我使用過從Sublime到VSCode的各種編輯器。但隨著現代前端技術的復雜度爆炸式增長&#xff08;想想一個React組件可能涉及JSX、CSS-in-JS、TypeScript和GraphQL&#xff09;&#xff0c;傳統…