ELK常見的問題

ELK 棧在使用過程中會遇到各種問題,以下是常見問題分類及解決方案,涵蓋 ?Elasticsearch、Logstash、Kibana 和 Beats(如 Filebeat)?? 四大組件:


🚨 ?一、連接與通信問題?

1. ?Elasticsearch 拒絕連接 (Connection Refused)??

  • ?原因?:ES 未啟動、防火墻攔截、配置文件綁定了 127.0.0.1
  • ?解決?:
    • 檢查狀態:systemctl status elasticsearch
    • 開放端口:
      sudo firewall-cmd --add-port=9200/tcp --permanent  # CentOS
      sudo ufw allow 9200/tcp                          # Ubuntu
    • 修改 elasticsearch.yml
      network.host: 0.0.0.0   # 允許外部IP訪問

2. ?Kibana 無法連接 Elasticsearch?

  • ?錯誤信息?:Kibana server is not ready yet
  • ?解決?:
    • 檢查 kibana.ymlelasticsearch.hosts 的 URL 是否正確(默認 http://localhost:9200)。
    • 確認 ES 健康狀態:curl http://localhost:9200/_cluster/health?pretty
    • 若開啟安全認證,需配置用戶名密碼:
      elasticsearch.username: "kibana_system"
      elasticsearch.password: "your_password"

📉 ?二、性能與資源問題?

1. ?Elasticsearch 集群變紅(Red Status)??

  • ?原因?:分片未分配(磁盤不足、節點離線)、索引損壞。
  • ?解決?:
    • 檢查磁盤空間:df -h
    • 查看未分配分片原因:
      curl -XGET 'http://localhost:9200/_cluster/allocation/explain?pretty'
    • 強制分配分片(謹慎操作):
      curl -XPOST 'localhost:9200/_cluster/reroute?retry_failed=true'

2. ?Logstash Pipeline 卡頓或高延遲?

  • ?原因?:輸入源壓力大、Filter 處理復雜、輸出目標 ES 響應慢。
  • ?優化方案?:
    • 增加 Logstash Worker 線程數(pipeline.workers)和批量大小(pipeline.batch.size)。
    • 簡化 Grok 正則,或使用 dissect 插件(性能更高)。
    • 添加 Kafka 作為緩沖隊列。

3. ?Elasticsearch 內存溢出(OOM)??

  • ?日志提示?:OutOfMemoryError
  • ?解決?:
    • 調整 JVM 堆大小(不超過物理內存 50%):
      # /etc/elasticsearch/jvm.options
      -Xms4g
      -Xmx4g
    • 避免大聚合查詢,使用 search.max_buckets 限制。
    • 啟用 Swap(緊急措施):bootstrap.memory_lock: false

📊 ?三、數據問題?

1. ?Kibana 中無日志顯示?

  • ?排查步驟?:
    1. 確認 Logstash/Filebeat 數據是否進入 ES:
      curl 'localhost:9200/_cat/indices?v'
    2. 檢查 Kibana 的 ?數據視圖(Data View)?? 是否包含目標索引(如 app-logs-*)。
    3. 在 Kibana Dev Tools 中手動查詢:
      GET /app-logs-*/_search
      { "query": { "match_all": {} } }

2. ?字段類型沖突(例如:字符串被識別為數字)??

  • ?錯誤?:mapper_parsing_exception
  • ?解決?:
    • 提前定義索引映射模板(Template):
      PUT /_template/app_logs_template
      {"index_patterns": ["app-logs-*"],"mappings": {"properties": {"user_id": { "type": "keyword" },  // 避免自動轉成 long"response_time": { "type": "float" }}}
      }

3. ?時區不一致?

  • ?現象?:Kibana 顯示時間比日志時間晚/早 8 小時。
  • ?解決?:
    • Logstash 中配置時區(filter 區塊):
      date {match => ["timestamp", "ISO8601"]timezone => "Asia/Shanghai"
      }

?? ?四、配置與日志解析問題?

1. ?Logstash Grok 解析失敗?

  • ?現象?:字段值為空或生成 _grokparsefailure 標簽。
  • ?排查?:
    • 使用 Grok Debugger 測試日志與模式。
    • 拆分復雜模式分步匹配:
      grok {match => { "message" => "%{SYSLOGTIMESTAMP:timestamp} %{WORD:level} %{GREEDYDATA:msg}" }
      }

2. ?Filebeat 多行日志合并問題?

  • ?日志堆棧被拆成多條記錄???
    • 修改 filebeat.yml
      multiline.type: pattern
      multiline.pattern: '^\['
      multiline.negate: true
      multiline.match: after

3. ?Logstash 無法解析 JSON 日志?

  • ?配置示例?:
    input { beats { port => 5044 } }
    filter {json {source => "message"   # 原始JSON在 message 字段remove_field => ["message"]}
    }

🔐 ?五、安全與權限問題?

1. ?Elasticsearch 開啟安全后無法訪問?

  • ?免費版開啟基礎安全?:
    1. 修改 elasticsearch.yml
      xpack.security.enabled: true
    2. 為內置用戶設密碼:
      /usr/share/elasticsearch/bin/elasticsearch-setup-passwords auto
    3. 在 Kibana 和 Filebeat/Logstash 配置中添加用戶名密碼。

2. ?Kibana 提示 “Missing authentication”??

  • 確保 Kibana 使用 kibana_system 角色配置正確的密碼。

🧩 ?六、其他高頻報錯?

1. ?Elasticsearch 只讀狀態 (Read-Only)??

  • ?日志提示?:blocked by: [FORBIDDEN/12/index read-only]
  • ?原因?:磁盤超過低水位線(默認 85%)。
  • ?臨時解除?:
    PUT _all/_settings
    { "index.blocks.read_only_allow_delete": null } 
  • ?長期方案?:清理舊數據或擴容磁盤。

2. ?Logstash:Could not execute action: PipelineAction::Create?

  • ?檢查?:
    • 配置文件語法錯誤(例如:少一個花括號 })。
    • 端口沖突(如兩個 Input 都監聽 5044)。
    • 運行調試模式:
      /usr/share/logstash/bin/logstash -f /path/to/config.conf --config.test_and_exit

3. ?Kibana:Unable to fetch mapping(索引模式問題)??

  • 刪除并重建數據視圖(Stack Management → Data Views)。

? ?高級建議?

  1. ?監控 ELK 自身日志?:用 Filebeat 收集 ES、Logstash、Kibana 的日志。
  2. ?啟用慢查詢日志?(ES):定位性能瓶頸。
    index.search.slowlog.threshold.query.debug: 10s
  3. ?冷熱數據分層?:使用 ILM(Index Lifecycle Management)自動轉移冷數據至廉價存儲。
  4. ?定期清理緩存?:特別是 Logstash 的 .sincedb 文件(記錄文件讀取位置)。

遇到具體問題時可查閱 Elastic 官方文檔 或通過日志細節(/var/log/elasticsearch/*.log)診斷。生產環境建議始終開啟監控(如 Elastic Agent 集成)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/92517.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/92517.shtml
英文地址,請注明出處:http://en.pswp.cn/web/92517.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

物理AI與人形機器人:從實驗室到產業化的關鍵跨越

2025年8月9日,北京——世界機器人大會(WRC)的開幕成為物理AI與機器人技術發展的集中展示場。英偉達在大會預告中首次提出“物理AI將重塑50萬億美元市場”的論斷,涵蓋工業制造、醫療、低空經濟等領域。與此同時,宇樹科技…

使用 Vuepress + GitHub Pages 搭建項目文檔(2)- 使用 GitHub Actions 工作流自動部署

在上一篇文章中,我們已經成功用 VuePress 搭建了項目文檔,并使用 sh 腳本部署到了 GitHub Pages。 但隨著文檔的更新頻率增加,每次都要手動推送,那有沒有不需要手動推送的方法呢?那必須有。 這次我們將用 GitHub Actio…

Python爬蟲實戰:研究PSpider框架,構建電商數據采集和分析系統

一、引言 1.1 研究背景 在大數據時代,數據已成為驅動科技創新、商業決策和社會發展的核心資源。據 IDC 預測,全球數據量將從 2020 年的 64ZB 增長至 2025 年的 175ZB,其中互聯網公開數據占比超過 60%。如何從海量網絡信息中高效、精準地提取有價值的數據,成為學術界和工業…

劍指offer第2版:動態規劃+記憶化搜索

前三題是同一種模型,所以我分別用遞推、記憶化、動歸來做 一、p74-JZ10 斐波那契數列 斐波那契數列_牛客題霸_牛客網 class Solution { public:int Fibonacci(int n) {// write code hereif(n1||n2) return 1;int a1,b1,c1;while(n>2){cab;ab;bc;--n;}return c…

Unity 調節 Rigidbody2D 響應速度的解決方案【資料】

可以通過多種方式調節 Unity 中 Rigidbody2D 的響應速度,包括降低物理更新頻率、屏蔽過小值以及優化物理參數。以下是幾種有效的實現方法:1. 降低物理更新頻率(不推薦直接修改)雖然可以修改 Time.fixedDeltaTime 來降低物理更新頻…

力扣-189.輪轉數組

題目鏈接 189.輪轉數組 class Solution {public void reverse(int[] nums, int i, int j) {while (i < j && i > 0 && j < nums.length) {int temp nums[i];nums[i] nums[j];nums[j] temp;i;j--;}}public void rotate(int[] nums, int k) {k k …

Linux命令行安裝Climate Data Operators(CDO)的方法

本文介紹在Linux操作系統的發行版本Ubuntu中&#xff0c;基于命令行&#xff0c;配置Climate Data Operators&#xff08;CDO&#xff09;這個用于操作、分析氣候及其他相關數據的命令行工具的方法。 最近&#xff0c;需要對一批.nc格式文件加以處理&#xff1b;在之前&#xf…

如何為您的服務器選擇正確的 PHP 版本

PHP作為最流行的服務器端腳本語言之一&#xff0c;持續演進并定期發布新版本。為您的服務器選擇正確的PHP版本對于網站性能、安全性和功能兼容性至關重要。本文將指導您如何做出明智的選擇。了解PHP版本的生命周期在選擇PHP版本前&#xff0c;首先需要了解PHP的版本支持政策&am…

從0開始的中后臺管理系統-5(userList動態展示以及上傳圖片和彈出創建用戶表單)

項目用的都是antd組件&#xff0c;這里的userList組件展示的表單組件的數據直接get請求拿過來展示的&#xff0c;這里隨機生成了50個用戶只是為了展示表單的api設置。首先就是表單展示需要兩個參數current和pageSize兩個屬性控制表單的最大分頁和當前頁面。那么我們就設置初始值…

Spring MVC REST API設計詳解:從零構建高效接口

1. Spring MVC與REST API基礎1.1 RESTful架構的六大約束詳解RESTful架構是Roy Thomas Fielding在2000年博士論文中提出的軟件架構風格&#xff0c;它包含六個核心約束&#xff0c;這些約束共同構成了RESTful API的設計原則。客戶端-服務器約束&#xff08;Client-Server&#x…

基于STM32F030C8T6單片機實現與CH224Q誘騙芯片的I2C通信和電壓輸出配置

基于項目的需要,對STM32F030的IIC研究了幾天,終于完成了通信,接下來具體實現如下: 本單片機使用的是PB8和PB9管腳進行實現,采用的是模擬的IIC進行 void MyI2C_W_SCL(uint8_t BitValue)//這三個函數將讀寫io口封裝起來,增強可讀性 { GPIO_WriteBit(GPIOB, GPIO_Pin_8…

TSMaster-C小程序使用

打開同星的TSMaster&#xff0c;推薦用32版本的&#xff0c;比64更穩定。同星的TSMaster的C小程序支持用戶嵌入代碼來控制CAN報文的收發邏輯。便于開發。點擊設計里面的C小程序。 比如我現在想用小程序來實現繼電器0先開后關開1s關1s&#xff0c;然后繼電器1開1s關1s…如此往復…

XSS滲透測試原理/步驟/攻擊方法/防御/常用語法

**核心概念回顧&#xff1a;**XSS漏洞一直被評估為web漏洞中危害較大的漏洞&#xff0c;在OWASP TOP10的排名中一直屬于前三的江湖地位。XSS是一種發生在前端瀏覽器端的漏洞&#xff0c;所以其危害的對象也是前端用戶。 形成XSS漏洞的主要原因是程序對輸入和輸出沒有做合適的處…

目標檢測數據集 - 自動駕駛場景道路異常檢測數據集下載「包含VOC、COCO、YOLO三種格式」

數據集介紹&#xff1a;自動駕駛場景道路異常檢測數據集&#xff0c;真實場景高質量道路圖片數據&#xff0c;涉及場景豐富&#xff0c;且類別豐富&#xff0c;劃分為 "LMVs 輕型機動車&#xff08;汽車、摩托車、小型卡車、小型貨車"、"HMVs 公交車、卡車、拖拉…

多模態新方向|從數據融合到場景落地,解鎖視覺感知新范式

來gongzhonghao【圖靈學術計算機論文輔導】&#xff0c;快速拿捏更多計算機SCI/CCF發文資訊&#xff5e;多模態學習&#xff08;Multimodal Learning&#xff09;是通過整合多種數據模態來提升模型對復雜場景感知與理解能力的技術&#xff0c;其核心是利用不同模態的互補性突破…

機器學習之隨機森林

目錄 一、什么是隨機森林&#xff1f; 1. 從決策樹到集成學習&#xff1a;為什么需要 "森林"&#xff1f; 2.什么是集成學習 二、隨機森林的工作原理 三、隨機森林構造過程 四、隨機森林api介紹 五、隨機森林的優缺點 六、垃圾郵件判斷案例 1.數據集介紹 ?…

云平臺運維工具 —— 阿里云原生工具

一、簡介阿里云作為國內領先的云服務提供商&#xff0c;擁有一套完整的原生運維工具體系&#xff0c;這些工具與阿里云的各類服務深度融合&#xff0c;能夠滿足用戶在資源部署、監控告警、權限管理、自動化運維等方面的需求。無論是簡單的應用托管還是復雜的企業級架構&#xf…

Linux-Day10.系統安全保護web服務管理

今日目標&#xff1a;- 日志管理- 系統安全保護 SELinux&#xff08;重點&#xff09;- 構建基本web服務&#xff08;重點&#xff09;環境準備還原快照網絡配置完成&#xff0c;開啟虛擬機A與虛擬機B用真機連通虛擬機去操作&#xff0c;準本好Xshell一、常用的網絡工具ip命令1…

解決:開啟魔法后vscode pip命令不能安裝中科大python鏡像問題

閑言少敘&#xff0c;最終實現效果就是在開啟魔法情況下&#xff0c;vscode命令行任何能通過中科大python鏡像安裝第三方庫&#xff0c;又快又不消耗魔法流量。簡單來說就兩步&#x1f447;&#xff1a; 第一步&#xff1a;配置 pip.ini 中的代理 找到或創建 pip.ini 文件&…

優化Google Pubsub到GCS的文件整合策略

引言 在使用Google Cloud Platform (GCP) 的Pubsub服務時,我們常常會遇到將消息存儲到Google Cloud Storage (GCS) 作為Avro文件的問題。本文將深入探討如何優化Google Pubsub到GCS的文件整合策略,以避免每個消息都單獨生成一個Avro文件,達到將多個消息整合到一個文件的目的…