carbondata入庫數據查詢異常排查

1,背景:carbondata的入庫segments對應的狀態都是success,但是查詢的時候報錯,在這里插入圖片描述
2,排查內容
1,segments的狀態 success
2,任務執行記錄日志 正常
3,找到對應查詢的天,指定對應的segments,進行查詢,有能查到數據的

SET carbon.input.segments.default.table_name = segments_id;
select * from table_name limit 1;
有結果
3,排查原因
1,表結構沒問題,之前查詢都是正常的
4,可能原因
1,數據入庫時候數據異常的問題
5,驗證4的想法
用腳本實現,逐個排查有問題的那一天的segments
發現有些segments沒有,最后排查,有些segment是有問題的,雖然狀態是succes,刪掉對應的segments,查詢正常
6,根據處理步驟,整理出來自動刪除腳本如下

 ############mkdir -pv  logs mkdir -pv  result##################第一個腳本,獲取segmentid以及比對異常segementidget_segment_id.sh 
#!/bin/bashsource /etc/profile
date_s=`date -d "1 day ago" +"%Y-%m-%d 00:00:01"`
date_e=`date -d "1 day ago" +"%Y-%m-%d 23:59:59"`rm -f ./result/*
rm -f *.txt/home/eversec/jdbc/bin/everdata-jdbc.sh -i "jdbc:hive2://10.192.21.1:10000" -q " SHOW SEGMENTS ON default.table_name as select * from table_name_segments where loadstarttime>='$date_s' and loadstarttime<='$date_e' order by loadStartTime asc limit 1;" -o  start_id.txt
/home/eversec/jdbc/bin/everdata-jdbc.sh -i "jdbc:hive2://10.192.21.1:10000" -q " SHOW SEGMENTS ON default.table_name as select * from table_name_segments where loadstarttime>='$date_s' and loadstarttime<='$date_e' order by loadStartTime desc limit 1;" -o  end_id.txtif [ -f start_id.txt ] && [ -f end_id.txt ]; thensid=`cat start_id.txt|awk -F',' '{print $1}'`eid=`cat end_id.txt|awk -F',' '{print $1}'`for ((i=$sid; i<=$eid; i++))do/home/eversec/jdbc/bin/everdata-jdbc.sh -i "jdbc:hive2://10.192.21.1:10000"  -q "SET carbon.input.segments.default.table_name =  $i; select * from table_name where order by hour limit 1;" -o ./result/$iecho $i >>auto_id.txtdonefi##################第二個腳本,刪除使用
cat dele_bad_segment.sh 
#!/bin/bashdele_id=""
ls ./result/* |awk -F'/' '{print $3}'> ./segment_id.txt
num_autoid=`cat auto_id.txt |wc -l`if [ $num_autoid -gt 0 ];thenwhile read linedonum=`cat segment_id.txt |grep "$line"|wc -l`if [ $num -eq 0 ];thenecho $line >> bad_segmentid.txtfidone <auto_id.txt
finum_de=`cat  bad_segmentid.txt |wc -l`
if [ $num_de -gt 0 ];thenend_id=`tail -1 bad_segmentid.txt` start_id=`head -1 bad_segmentid.txt`while read linedoif [ $line -eq $start_id ] ;thendele_id="${line}"elif [ $line -ne $start_id ];thendele_id="${dele_id},${line}"fidone <bad_segmentid.txtecho $dele_id/home/eversec/jdbc/bin/everdata-jdbc.sh -i "jdbc:hive2://10.192.21.1:10000" -q "DELETE FROM TABLE table_name  WHERE SEGMENT.ID IN ($dele_id);"
fi

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/23758.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/23758.shtml
英文地址,請注明出處:http://en.pswp.cn/web/23758.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

8255A-LED

DATA SEGMENTPORTA EQU 280H ;A端口地址PORTB EQU 281H ;B端口地址PORTD EQU 283H ;命令口地址 DATA ENDSCODE SEGMENTASSUME CS:CODE,DS:DATA START:MOV AX, DATAMOV DS, AXMOV DX, PORTDMOV AL, 10010000BOUT DX,ALMOV DX, 281H MOV AL, 00HOUT DX, ALWAIT1:MOV DX, POR…

【JavaEE精煉寶庫】多線程(4)深度理解死鎖、內存可見性、volatile關鍵字、wait、notify

目錄 一、死鎖 1.1 出現死鎖的常見場景&#xff1a; 1.2 產生死鎖的后果&#xff1a; 1.3 如何避免死鎖&#xff1a; 二、內存可見性 2.1 由內存可見性產生的經典案例&#xff1a; 2.2 volatile 關鍵字&#xff1a; 2.2.1 volatile 用法&#xff1a; 2.2.2 volatile 不…

C/C++ 檢測文件是否存在的方法

在C和C中&#xff0c;檢測文件是否存在的方法通常涉及到平臺特定的API或者使用標準庫的功能&#xff08;在C17及以后版本中&#xff09;。以下是幾種常見的方法&#xff1a; C 在C中&#xff0c;通常使用POSIX標準&#xff08;在Unix-like系統上&#xff09;或Windows API&am…

PostgreSQL的視圖pg_stat_user_tables

PostgreSQL的視圖pg_stat_user_tables pg_stat_user_tables 是 PostgreSQL 中的一個系統視圖&#xff0c;用于顯示用戶定義的表的統計信息。這些統計信息包括表的訪問情況、修改情況以及很多其他的性能指標。這個視圖為數據庫管理員提供了豐富的數據&#xff0c;可以幫助他們進…

使用 Scapy 庫編寫 ICMP 時間戳攻擊腳本

一、介紹 ICMP時間戳攻擊&#xff08;ICMP Timestamp Attack&#xff09;是一種利用ICMP協議中的Timestamp請求和響應消息來實施的攻擊。攻擊者發送大量的ICMP Timestamp請求消息到目標主機&#xff0c;以觸發目標主機對每個請求進行響應&#xff0c;從而消耗目標系統的網絡資…

Codeforces Round 950 (Div. 3)

好久沒寫題解了&#xff0c;今天來寫個題解。 A - 問題 Generator #include "bits/stdc.h" using namespace std;#define int long long #define endl \n #define IOS ios::sync_with_stdio(0),cin.tie(0); #define all(x) x.begin(),x.end() #define pi pair<in…

【Linux】(一)——Linux基礎和Linux命令基礎語法

目錄 Linux基礎Linux發行版本Linux終端Linux命令 Linux基礎 Linux&#xff0c;通常指的是GNU/Linux操作系統&#xff0c;這是一個開源且免費使用的類UNIX操作系統。它的核心組件——Linux內核&#xff0c;由林納斯托瓦茲&#xff08;Linus Torvalds&#xff09;在1991年10月5日…

Arthas使用教程——JVM常用命令

JVM相關命令 dashboard——當前系統的實時數據面板 顯示當前 tomcat 的實時信息。 使用方式&#xff1a;dashboard 數據說明 ID: Java 級別的線程 ID&#xff0c;注意這個 ID 不能跟 jstack 中的 nativeID 一一對應。 NAME: 線程名 GROUP: 線程組名 PRIORITY: 線程優先級…

Rocky Linux安裝與基礎配置

目錄 背景與起源 主要特點 目標用戶 發展前景 下載 安裝 常用配置命令&#xff1a; 更換鏡像源 Rocky Linux 是一個開源的、由社區驅動的操作系統&#xff0c;旨在使用 Red Hat Enterprise Linux&#xff08;RHEL&#xff09;源碼構建的下游二進制兼容發行版。以下是關于…

優思學院|一文看懂新版FMEA與FMEA的七大步驟

FMEA的起源 FMEA最早起源于20世紀40年代的美國軍工行業。當時&#xff0c;美國軍方為了提高武器系統的可靠性和安全性&#xff0c;開始使用FMEA來識別和評估潛在的故障模式及其影響。1949年&#xff0c;美國軍方發布了《軍用程序手冊》&#xff08;Military Procedures Handbo…

【Android面試八股文】在Java中重載和重寫是什么意思,區別是什么?

文章目錄 在Java中重載和重寫是什么意思,區別是什么?這道題想考察什么 ?考察的知識點考生應該如何回答重載(Overloading)重寫(Overriding)重載和重寫的區別在Java中重載和重寫是什么意思,區別是什么? 這道題想考察什么 ? Java基礎 考察的知識點 面向對象多態的基…

五種網絡IO模型

目錄 前言 文件描述符 為什么要多種io模型 同步IO 1.阻塞IO 2.非阻塞IO 3.多路復用IO&#xff08;事件驅動IO&#xff09; select: poll&#xff1a; epoll&#xff1a; 4.信號驅動IO 異步IO 區別 前言 文件描述符 首先我們了解一下文件描述符是什么&#xff1a;…

【Python報錯】已解決AttributeError: ‘method‘ object has no attribute ‘xxx‘

解決Python報錯&#xff1a;AttributeError: ‘method’ object has no attribute ‘xxx’ 在Python中&#xff0c;AttributeError通常表明你試圖訪問的對象沒有你請求的屬性或方法。如果你遇到了AttributeError: method object has no attribute xxx的錯誤&#xff0c;這通常意…

批量處理腳本,用于刪除指定目錄下3天前的備份文件和日志。

echo off echo 刪除3天前的備份文件和日志 set SrcDirD:\home set DaysAgo3 echo 準備刪除3天前的備份文件和日志 forfiles /p %SrcDir% /d -%DaysAgo% /c "cmd /c del /f /q /a path && rd /s /q path" echo 正在執行刪除&#xff0c;請稍等…… set SrcDi…

奇跡MU最強法師介紹

1、黑龍波 釋放出深淵中的黑龍之魂&#xff0c;對一定范圍內的目標造成中等程度傷害。 奧義&#xff1a; 怒哮——法師釋放出深淵龍魂的怨怒之力&#xff0c;在電閃雷鳴中中咆哮的龍魂將對敵人額外造成少量傷害。 魂陣——法師利用法陣控制黑龍之魂進行更大范圍的攻擊&…

如何使用SeaFile文件共享服務器結合內網穿透將家中電腦變成個人云盤

文章目錄 1. 前言2. SeaFile云盤設置2.1 Owncould的安裝環境設置2.2 SeaFile下載安裝2.3 SeaFile的配置 3. cpolar內網穿透3.1 Cpolar下載安裝3.2 Cpolar的注冊3.3 Cpolar云端設置3.4 Cpolar本地設置 4.公網訪問測試5.結語 1. 前言 本文主要為大家介紹&#xff0c;如何使用兩個…

opt 優化

【整理】深入理解拉格朗日乘子法&#xff08;Lagrange Multiplier) 和KKT條件 【amos注】&#xff1a;通俗易懂&#xff0c;讓人易于理解。

【Oracle篇】rman全庫異機恢復:從RAC環境到單機測試環境的轉移(第四篇,總共八篇)

&#x1f4ab;《博主介紹》&#xff1a;?又是一天沒白過&#xff0c;我是奈斯&#xff0c;DBA一名? &#x1f4ab;《擅長領域》&#xff1a;??擅長Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式數據倉庫)、Linux&#xff0c;也在擴展大數據方向的知識面??…

【TensorFlow深度學習】深度學習中的損失函數種類與適用場景

深度學習中的損失函數種類與適用場景 深度學習中的損失函數種類與適用場景&#xff1a;精確度量模型誤差的藝術一、均方誤差&#xff08;Mean Squared Error, MSE&#xff09;二、交叉熵損失&#xff08;Cross-Entropy&#xff09;三、Hinge損失&#xff08;Margin Loss&#x…

ROS RViz觀測傳感器數據

ROS RViz觀測傳感器數據 The Robot Visualization Tool 可視化工具 機器人傳感器采集到的數據都可以圖形化的顯示在這個軟件里&#xff0c;機器人運算處理的中間結果&#xff0c;和即將要執行的目標指示&#xff0c;比如機器人對空間中某個物體進行識別后&#xff0c;我們可以…