Elasticsearch:Ingest architectures - 攝取架構

我們提供各種采集架構,以滿足各種用例和網絡配置的需求。

要將數據采集到 Elasticsearch,請使用最符合你的需求和用例的選項。對于許多用戶和用例來說,最簡單的方法是使用 Elastic Agent 采集數據并將其發送到 Elasticsearch。Elastic Agent 和 Elastic Agent 集成適用于許多流行的平臺和服務,是一個不錯的起點。

提示:你可以在自己的硬件上托管 Elasticsearch,也可以將數據發送到 Elastic Cloud 上的 Elasticsearch。對于大多數用戶來說,Elastic Agent 直接寫入 Elastic Cloud 上的 Elasticsearch 是最簡單、最快捷的實現價值的方式。我們的托管 Elasticsearch 服務可在 AWS、GCP 和 Azure 上使用,你可以免費試用。

更多關于攝取架構的文章,你可以詳細閱讀文章 “Elastic:開發者上手指南” 中的 “Elastic Stack 架構” 章節。

添加數據到 Elasticsearch 中

你可以通過多種方式將數據導入 Elasticsearch,這稱為提取或索引數據。使用 Elastic Agent、Beats、Logstash、Elastic 語言客戶端、Elastic 連接器或企業搜索網絡爬蟲。所選的選項(或組合)取決于你是索引一般內容還是帶時間戳的數據。

一般內容

  • 索引 HTML 頁面、目錄和其他文件等內容。使用 Elastic 語言客戶端將數據從應用程序直接發送到 Elasticseach。否則,請使用 Elastic 內容 connectors 或 Elastic 網絡爬蟲。

帶時間戳的數據

  • 索引帶時間戳的數據的首選方法是使用 Elastic Agent。Elastic Agent 是一種向主機添加日志、指標和其他類型數據監控的單一、統一方法。它還可以保護主機免受安全威脅、查詢操作系統的數據以及轉發遠程服務或硬件的數據。每個基于 Elastic Agent 的集成都包括默認的提取規則、儀表板和可視化,可立即開始分析你的數據。Fleet Management 使你能夠從 Kibana 集中管理所有已部署的 Elastic Agent。
  • 如果你的數據源沒有可用的 Elastic Agent 集成,請使用 Beats 收集數據。Beats 是數據傳送器,旨在從服務器收集和傳送特定類型的數據。你可以為要收集的每種類型的數據安裝一個單獨的 Beat。某些 Beats(例如 Filebeat 和 Metricbeat)可以使用提供默認配置、Elasticsearch 采集管道定義和 Kibana 儀表板的模塊。不為 Beats 提供 fleet 管理功能。
  • 如果 Elastic Agent 和 Beats 都不支持你的數據源,請使用 Logstash。Logstash 是一個開源數據收集引擎,具有實時管道功能,支持各種數據源。你還可以使用 Logstash 來保存傳入數據,以確保在出現采集高峰或需要將數據發送到多個目的地時數據不會丟失。

設計數據提取管道

雖然你可以將數據直接發送到 Elasticsearch,但數據提取管道通常包括其他步驟來操作數據、確保數據完整性或管理數據流。

注意:該圖重點關注帶時間戳的數據。

數據處理

在將數據編入索引并存儲在 Elasticsearch 中之前,通常需要對其進行清理、規范化、轉換或豐富。

  • Elastic Agent 和 Beats 處理器使你能夠在邊緣處理數據。如果你需要控制通過網絡發送的數據,或者需要使用主機上可用的信息豐富原始數據,這將非常有用。
  • Elasticsearch 攝取管道使你能夠在數據進入時對其進行處理。這避免了在你從中收集數據的主機上增加額外的處理開銷。
  • Logstash 使你能夠避免在邊緣進行重量級處理,但仍可以在將數據發送到 Elasticsearch 之前對其進行處理。這還使你能夠將處理后的數據發送到多個目的地。

預處理數據的一個原因是控制編入 Elasticsearch 的數據結構 —— 數據模式(data schema)。例如,使用攝取管道將數據映射到 Elastic Common Schema (ECS)。或者,在查詢時使用運行時字段來:

  • 無需了解數據的結構即可開始處理數據
  • 無需重新索引數據即可向現有文檔添加字段
  • 覆蓋索引字段返回的值
  • 無需修改底層架構即可為特定用途定義字段

數據完整性

Logstash 可增強你不想丟失的重要數據的數據彈性。Logstash 提供磁盤持久隊列 (persistent queue - PQ),無需外部緩沖機制即可吸收突發事件。它會嘗試傳遞存儲在 PQ 中的消息,直到傳遞至少成功一次。

Logstash 死信隊列 (dead letter queue - DLQ) 為 Logstash 無法處理的事件提供磁盤存儲,讓你有機會評估它們。你可以使用 dead_letter_queue 輸入插件輕松地重新處理 DLQ 事件。

數據流

如果你需要從多個 Beats 或 Elastic Agents 收集數據,請考慮使用 Logstash 作為代理。Logstash 可以從多個端點(即使在不同的網絡上)接收數據,并通過單個防火墻規則將數據發送到 Elasticsearch。與為每個端點設置單獨的規則相比,你可以用更少的工作獲得更高的安全性。

Logstash 可以從單個管道發送到多個輸出,以幫助你從數據中獲取最大價值。

接下來該怎么做

我們有指南和許多實踐教程,可幫助你開始將數據導入集群。

為 Elastic 解決方案導入數據

開始使用 Elastic Observability

  • 使用 Elastic Observability 深入了解你的應用程序和系統的行為。按照我們的指南提取各種數據類型,例如日志和指標、跟蹤和 APM 以及來自 Splunk 的數據。還有幾個教程可供選擇。

將數據添加到 Elastic Security

  • 使用 Elastic Security 快速檢測、調查和應對整個環境中的威脅和漏洞。你可以使用 Elastic Agent 將數據提取到 Elastic Defend 集成中,或與許多其他與 Elastic Security 協同工作的集成一起使用。你還可以從 Splunk 或發送符合 ECS 的安全數據的各種第三方收集器中提取數據。

使用 Elastic Agent、Beats 和 Logstash 采集數據

對于想要構建自己的解決方案的用戶,我們可以幫助你開始使用 Elasticsearch Platform 產品采集數據。

Elastic 集成

  • Elastic 集成是一種將數據連接到 Elastic Stack 的簡化方式。集成適用于流行的服務和平臺,如 Nginx、AWS 和 MongoDB,以及許多通用輸入類型,如日志文件。

Beats 和 Elastic Agent 比較

  • Beats 和 Elastic Agent 都可以直接或通過 Logstash 向 Elasticsearch 發送數據。你可以使用本指南來確定這些主要采集工具中的哪一個最適合你的用例。

Fleet 管理簡介

  • Fleet 在 Kibana 中提供了一個基于 Web 的 UI,用于集中管理 Elastic Agent 及其策略。

Logstash 簡介

  • 使用 Logstash 動態統一來自不同來源的數據,并將數據規范化到你選擇的目的地。

使用 Elastic 網絡爬蟲、連接器提取數據

使用網絡爬蟲添加數據

  • 使用網絡爬蟲以編程方式從網站和知識庫中發現、提取和索引可搜索內容。

使用連接器添加數據

  • 將數據從原始數據源同步到 Elasticsearch 索引。連接器使你能夠創建數據源的可搜索、只讀副本。

從你的應用程序中提取數據

Elasticsearch 語言客戶端

  • 使用 Elasticsearch 語言客戶端將應用程序中的數據提取到 Elasticsearch 中。

企業搜索語言客戶端

  • 企業搜索編程語言客戶端庫為這些語言提供本機 API,以將數據提取到企業搜索、應用搜索和工作場所搜索中。

應用程序提取教程

  • 這些實踐指南演示了如何使用 Elasticsearch 語言客戶端從你的應用程序中提取數據。

操作和預處理數據

攝取管道 - ingest pipeline

  • Elasticsearch 采集管道可讓你在索引之前對數據執行常見轉換。

Elastic Agent 處理器

  • 使用 Elastic Agent 輕量級處理器在源頭解析、過濾、轉換和豐富數據。

創建 Logstash 管道

  • 通過將插件(輸入、輸出、過濾器,有時還有編解碼器)串聯在一起來創建 Logstash 管道,以便在采集期間處理數據。

示例數據

如果你剛剛開始了解 Elastic,并且還沒有想好具體的用例,那么你可以加載 Kibana 中的一個示例數據集。它們配有示例可視化、儀表板等,可以快速了解 Elastic 的潛力。

攝取架構

Elastic Agent 到 Elasticsearch

什么時候使用?

你的數據源可以使用 Elastic Agent 集成:

  • 安裝了 Elastic Agent 的軟件組件
  • 使用 API 進行數據收集的軟件組件

Elastic Agent 經 Logstash 到 Elasticsearch

什么時候使用?

你需要 Logstash 提供的附加功能:

  • Elastic Agent 和 Elasticsearch 之間的豐富
  • 持久隊列 (PQ) 緩沖以適應網絡問題和下游不可用
  • 在 Elastic Agent 對 Elastic Agent 網絡外部連接有網絡限制的情況下進行代理
  • 數據需要根據內容路由到多個 Elasticsearch 集群和其他目的地

Elastic Agent 代理至 Elasticsearch

什么時候使用?

  • Agents 具有網絡限制,阻止連接到 Elastic Agent 網絡之外。請注意,Logstash 作為代理是一種選擇。

Elastic Agent 到 Elasticsearch,使用 Kafka 作為中間件消息隊列

什么時候使用?

Kafka 是你的中間件消息隊列:

  • Kafka ES 接收連接器,用于從 Kafka 寫入 Elasticsearch
  • Logstash,用于從 Kafka 讀取并路由到 Elasticsearch

Logstash 到 Elasticsearch

什么時候使用?

  • 你需要從 Elastic Agent 無法讀取的源(例如數據庫、AWS Kinesis)收集數據。查看 Logstash 輸入插件。

Elastic 物理隔離架構

什么時候使用?

  • 你想要在隔離環境中部署 Elastic Agent 和 Elastic Stack(無法訪問外部網絡)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41024.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41024.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41024.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度學習——深度學習中感受野的計算

感受野 在卷積神經網絡(CNN)中,感受野(Receptive Field) 是一個非常重要的概念。它描述了網絡中某一層的輸出(通常是特征圖上的一個像素點)所對應的輸入圖像上的空間范圍。這個范圍代表了該輸出…

【CSS】了解grid-template-areas屬性

grid-template-areas 屬性是 CSS Grid 布局中一個非常有用的特性,它允許你通過命名網格區域(grid areas)來直接控制網格項目的布局。這個屬性通過引用網格容器內部網格項目的名稱來定義網格區域的布局,使得布局的設計更加直觀和易…

SARscape——地理編碼與輻射定標

目錄 一、算法原理1、概述2、參考文獻 二、軟件操作三、結果展示1、原始圖像2、處理結果 一、算法原理 1、概述 SAR系統觀測到的是電磁波入射地球表面后反射(后向散射)的雷達脈沖的強度和相位信息。這個信息編碼到雷達坐標系統下,即斜距坐標…

DataFrame 的常用操作

DataFrame是什么? DataFrame 是一種用于處理和分析數據的二維標簽數據結構。它類似于Excel中的電子表格或數據庫中的表格,由行和列組成。每個列可以是不同的數據類型(如整數、浮點數、字符串等),并且可以進行各種數據操…

vb與數據庫編程

第一節 一、數據庫基礎知識 數據庫的概念 數據庫是按照數據結構來組織、存儲和管理數據的倉庫。 它可以存儲大量的數據,并提供高效的數據訪問和管理功能。 數據庫的類型 關系型數據庫:如 SQL Server、MySQL、Oracle 等,以表格形式存儲數據,通過關系(如主鍵和外鍵)來關聯不…

數據結構之二叉樹概念

數據結構之二叉樹 二叉樹簡介分類普通二叉樹平衡二叉樹滿二叉樹二叉搜索樹(二叉排序樹、二叉查找樹),平衡二叉樹紅黑樹 B樹類型B樹(B-樹、B_樹)B樹B*樹 二叉樹 簡介 二叉樹(Binary Tree) :是一種非常重要…

RPC框架之Dubbo

Dubbo 是一款高性能、輕量級的開源 Java RPC(Remote Procedure Call)框架,由阿里巴巴集團于2011年發布。Dubbo 主要用于實現基于微服務架構的分布式應用,通過提供服務注冊與發現、負載均衡、容錯等功能,極大地簡化了服…

頭歌資源庫(19)在排序數組中查找元素的首尾位置

一、 問題描述 二、算法思想 該問題可以通過二分查找的思想來解決。 首先,我們可以使用二分查找找到目標值在數組中的任意一個位置(即該位置的值等于目標值)。假設找到的位置為mid。 接下來,我們需要在mid的左邊和右邊分別找到…

UNIAPP_頂部導航欄右側添加uni-icons圖標,并綁定點擊事件,自定義導航欄右側圖標

效果 1、導入插件 uni-icons插件:https://ext.dcloud.net.cn/plugin?nameuni-icons 復制 uniicons.ttf 文件到 static/fonts/ 下 僅需要那個uniicons.ttf文件,不引入插件、單獨把那個文件下載到本地也是可以的 2、配置頁面 "app-plus":…

Python爬蟲+數據分析+數據可視化圖形-爬取高校排名數據

①本文主要使用python 爬取了中國大學排名前30的大學信息,并進行了數據處理及分析,是一個比較經典的python爬蟲和分析項目 ②主要內容:爬蟲數據預處理數據可視化分析 完整代碼請看這里拿👇↓↓↓

Flutter本地數據持久化的幾種方式

目錄 前言 一、shared_preferences 1.添加依賴 2.保存數據 3.讀取數據 4.移除數據 5.Shared_preferences的優缺點 6.完整的示例代碼 二、path_provider 1.導入path_provider 2.創建文件讀寫的目錄 3.向文件中寫入數據 4.從文件中讀取數據 5.完整的示例代碼 三、…

Mac本地部署大模型-單機運行

前些天在一臺linux服務器(8核,32G內存,無顯卡)使用ollama運行阿里通義千問Qwen1.5和Qwen2.0低參數版本大模型,Qwen2-1.5B可以運行,但是推理速度有些慢。 一直還沒有嘗試在macbook上運行測試大模型&#xf…

我這個經驗好找嵌入式的工作嗎?

大家好,我是麥鴿。最近網友的提問,這樣的經驗,好找嵌入式的工作嗎? 下面是網友的情況: 本人目前大二機器人工程,未來想要入職嵌入式行業,有robomaster比賽經驗本人負責電控,但是由于…

基因組學系列3:基因分型Phasing與單倍型參考序列HRC

1. 基因分型Phasing概念 基因分型,也稱為基因定相、單倍體分型、單倍體構建等,即將一個二倍體(或多倍體)基因組上的等位基因(或雜合位點)正確定位到父親或母親的染色體上,最終使得來自同一親本…

相親交友APP系統婚戀交友社交軟件開發語音視頻聊天平臺定制開發-婚戀相親交友軟件平臺介紹——app小程序開發定制

互聯網飛速發展的時代,相親交友軟件成為了許多年輕人首選的相親方式,越來越多的單身男女希望在婚戀交友軟件平臺上尋找靈魂伴侶,相親交友軟件因此具有很高的市場價值。 多客婚戀相親交友系統是一款定位高端,到手就能運營的成熟婚戀…

軟件測評中心▏軟件驗收測試方法和測試內容簡析

在當今數字化轉型的浪潮下,軟件驗收測試變得越來越重要。軟件驗收測試,顧名思義,是對軟件進行驗收的過程中進行的一項測試。它用于確保軟件在滿足需求、達到預期效果后才能正式交付給客戶使用。軟件驗收測試是一項全面、系統的測試過程&#…

sublime 3 背景和字體顏色修改

sublime 4 突然抽風,每次打開都顯示 “plugin_host-3.3 has exited unexpectedly, some plugin functionality won’t be available until Sublime Text has been restarted” 一直沒調好,所以我退回到sublime 3了。下載好了軟件沒問題,但是一…

半導體光電

《半導體光電》創刊于1976年,是由中國電子科技集團公司主管、重慶光電技術研究所(中國電子科技集團公司第四十四研究所)主辦的中文科技期刊。本刊國內外公開發行,經過四十余年的發展已經成為我國光電子專業領域有代表性的刊物。 …

Zabbix 配置grafana對接

zabbix對接grafana簡介 Zabbix與Grafana對接可以實現更加豐富和美觀的數據可視化,可以讓您利用Grafana強大的可視化功能來展示Zabbix收集的數據。 zabbix插件的兩種安裝方式 使用grafana-cli 命令進行安裝在grafana管理頁面中進入Administration/Plugins and dat…

2024.7.4學習日報

1、ppt前三章 5日計劃 1、至少做到實驗 2、java