Paimon和Hive相集成

Paimon版本1.17

Hive版本3.1.3

1、Paimon集成Hive

將paimon-hive-connector.jar復制到auxlib中,下載鏈接Index of /groups/snapshots/org/apache/https://repository.apache.org/snapshots/org/apache/paimon/

通過flink進入查看paimon

/opt/softwares/flink-1.17.0/bin/sql-client.sh -s yarn-session -i /opt/softwares/flink-1.17.0/conf/sql-client-init.sql

?sql-client-init.sql

CREATE CATALOG fs_catalog WITH ('type' = 'paimon','warehouse' = 'hdfs://node154:8020/paimon/fs'
);CREATE CATALOG hive_catalog WITH ('type' = 'paimon','metastore' = 'hive','uri' = 'thrift://node154:9083','hive-conf-dir' = '/opt/softwares/hive/conf','warehouse' = 'hdfs://node154:8020/paimon/hive'
);USE CATALOG hive_catalog;SET 'sql-client.execution.result-mode' = 'tableau';

注意,加載配置文件進入flink之后,雖然說使用的是hive_catalog,但是使用的database是default的,需要使用test,否則找不到表歐。

?表ws_t;和名為test的database都是之前是在flink中操作paimon在hive_catalog 創建出來的,步驟看

paimon中批和流查看過去的快照的數據及變動的數據-CSDN博客文章瀏覽閱讀258次,點贊10次,收藏4次。paimon中批和流查看過去的快照的數據及變動的數據 https://blog.csdn.net/yyf960126/article/details/147930584?spm=1001.2014.3001.5502

進入hive

hive中
use test;
SELECT * FROM ws_t;

補充知識點,hive中使用【test】database來創建hive表和paimon中使用使用hive_catalog中【test】的database創建出的paimon表存儲位置不同,建表語句也能看出來。但是都能在hive中【test】的database查到。

hive查看test庫中的表為

orders ? ?  ?paimon表
ws1? ? ? ? ? paimon表
ws_t? ? ? ? ?paimon表
test_hive ?  hive表
yyf? ? ? ? ? hive表

文件存儲為如圖:

---------------paimon表---------------------
CREATE TABLE `ws_t`(`id` int COMMENT 'from deserializer', `ts` bigint COMMENT 'from deserializer', `vc` int COMMENT 'from deserializer')
ROW FORMAT SERDE 'org.apache.paimon.hive.PaimonSerDe' 
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler' LOCATION'hdfs://node154:8020/paimon/hive/test.db/ws_t'
TBLPROPERTIES ('transient_lastDdlTime'='1747128118')
-----------------hive表------------------
CREATE TABLE `yyf`(`a` int)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION'hdfs://node154:8020/user/hive/warehouse/test.db/yyf'
TBLPROPERTIES ('bucketing_version'='2', 'transient_lastDdlTime'='1747066788')

?在hive中創建paimon表

--使用hive_catalog的存儲路徑
SET hive.metastore.warehouse.dir=hdfs://node154:8020/paimon/hive;
--數據處理按照paimon來
CREATE TABLE test_h(a INT COMMENT 'The a field',b STRING COMMENT 'The b field'
)
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'

?

?通過創建hive外部表來使用現有的paimon表

字段隨著paimon源表的修改而自動變動,paimon表的特性

CREATE EXTERNAL TABLE test.paimon_ex_ws_t
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'
LOCATION 'hdfs://node154:8020/paimon/hive/test.db/ws_t';--或將路徑寫在表屬性中:
CREATE EXTERNAL TABLE paimon_ex_ws_t
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'
TBLPROPERTIES ('paimon_location' ='hdfs://node154:8020/paimon/hive/test.db/ws_t'
);

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/80863.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/80863.shtml
英文地址,請注明出處:http://en.pswp.cn/web/80863.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Leetcode 每日一題】3362. 零數組變換 III

問題背景 給你一個長度為 n n n 的整數數組 n u m s nums nums 和一個二維數組 q u e r i e s queries queries,其中 q u e r i e s [ i ] [ l i , r i ] queries[i] [l_i, r_i] queries[i][li?,ri?]。 每一個 q u e r i e s [ i ] queries[i] queries[i]…

計算機視覺與深度學習 | 用于圖像分割的自監督學習(Self-Supervised Learning)方法綜述

圖像分割 用于圖像分割的自監督學習(Self-Supervised Learning)方法綜述**1. 背景與意義****2. 方法演進****3. 圖像分割子任務與SSL策略****4. 自監督預訓練任務分類****5. 基準數據集與評估指標****6. 挑戰與未來方向****總結**用于圖像分割的自監督學習(Self-Supervised …

Jenkins集成Docker與K8S構建

Jenkins 是一個開源的持續集成和持續交付(CI/CD)工具,廣泛用于自動化軟件開發過程中的構建、測試和部署任務。它通過插件系統提供了高度的可擴展性,支持與多種開發工具和技術的集成。 Jenkins 的核心功能 Jenkins 的主要功能包括自動化構建、測試和部署。它能夠監控版本控…

使用 adb 命令截取 Android 設備的屏幕截圖

使用 adb 命令截取 Android 設備的屏幕截圖。以下是兩種常見的方法: 方法一:截屏后保存到電腦 adb shell screencap -p /sdcard/screenshot.png adb pull /sdcard/screenshot.png解釋: adb shell screencap -p /sdcard/screenshot.png&…

參與開發的注意事項

1.開發期間,不要擅自修改架構的內容 使用技術官發的項目文件夾來開發,而不是自己建立項目, 否則會導致環境不統一 架構內容:(不能更改) 1.類型定義,全局變量聲明 2.函數申明(函數名稱…

linux安裝nginx和前端部署vue項目

1、打包前端項目 npm run build 執行完后會在根目錄下生成一個dist文件夾,這個dist文件夾就是我們后面要部署到nginx的東西。 2、將dist文件夾上傳到服務器中 自己建一個目錄,上傳即可(盡量不要在root目錄下,可能涉及權限問題…

親測有效!OGG 創建抽取進程報錯 OGG-08241,如何解決?

前言 今天在測試 OGG 一個功能的時候,需要重新初始化 oggca,所以重裝了一下 OGG。重建完之后重新添加抽取進程報錯,一直無法添加成功: 經過一翻分析,找到了解決方案,本文記錄一下解決過程。 問題描述 OG…

Docker構建 Dify 應用定時任務助手

概述 Dify 定時任務管理工具是一個基于 GitHub Actions 的自動化解決方案,用于實現 Dify Workflow 的定時執行和狀態監控。無需再為缺乏定時任務支持而感到困擾,本工具可以幫助設置自動執行任務并獲取實時通知,優化你的工作效率。 注意&…

ubuntu24.04+RTX5090D 顯卡驅動安裝

初步準備 Ubuntu默認內核太舊,用mainline工具安裝新版: sudo add-apt-repository ppa:cappelikan/ppa sudo apt update && sudo apt full-upgrade sudo apt install -y mainline mainline list # 查看可用內核列表 mainline install 6.13 # 安裝…

網絡爬蟲(Web Crawler)詳解

網絡爬蟲(Web Crawler)詳解 1. 基本概念與核心目標 定義: 網絡爬蟲是一種自動化的程序,通過HTTP協議訪問網頁,提取并存儲數據(如文本、鏈接、圖片),并根據策略遞歸訪問新鏈接。核心目標: 數據采集:抓取特定網站或全網公開數據。索引構建:為搜索引擎提供頁面內容(如…

大模型如何助力數學可視化?

大家好,我是 i 學習的老章 在數學學習和教學中,將抽象概念可視化對于理解至關重要。Manim 是一個強大的數學動畫引擎,由著名數學科普視頻作者 3Blue1Brown 開發并廣為人知。 老章較早之前就介紹過 manim:B 站上爆紅的數學視頻&a…

Oracle基礎知識(二)

目錄 1.聚合函數 2.COUNT(1)&COUNT(*)&COUNT(字段)區別(面試常問) 3.分組聚合——group by 4.去重:DISTINCT 、GROUP BY 5.聚合函數的過濾HAVING 6.oracle中having與where的區別 (面試常問) 7.ROUND與TRUNC函數 8.ROLLUP上卷…

DTAS 3D多約束裝配助力懸架公差分析尺寸鏈計算:麥弗遜/雙叉臂/多連桿/H臂一網打盡

摘要:汽車四輪定位參數與懸架密切相關。汽車懸架對于車輛的行駛性能、安全性和舒適性至關重要。DTAS 3D提供了各類型懸架的公差仿真分析方法。 關鍵字:DTAS 3D、前后懸架、公差仿真分析、 運動耦合 一、懸架公差分析綜述 懸架是車身(或車架…

Serverless爬蟲架構揭秘:動態IP、冷啟動與成本優化

一、問題背景:舊技術的瓶頸 在傳統爬蟲架構中,我們通常部署任務在本地機器或虛擬機中,搭配定時器調度任務。雖然這種方式簡單,但存在以下明顯缺陷: 固定IP易被封禁:目標網站如拼多多會通過IP頻率監控限制…

設備預測性維護的停機時間革命:中訊燭龍如何用AI重構工業設備管理范式

在工業4.0的智能化浪潮中,非計劃停機每年吞噬企業3%-8%的產值。中訊燭龍預測性維護系統通過多模態感知矩陣分布式智能體的創新架構,實現設備健康管理的范式躍遷,幫助制造企業將停機時間壓縮70%以上。本文將深度解析技術實現路徑與行業級實踐方…

Java面試攻略:從Spring Boot到微服務架構的深入探討

Java面試攻略:從Spring Boot到微服務架構的深入探討 場景設定 在一家知名互聯網大廠的會議室里,資深面試官王老師正在對一位求職者謝飛機進行技術面試。謝飛機是一位幽默風趣的程序員,他的回答有時讓人捧腹大笑。 第一輪:核心技…

LlamaIndex

1、大語言模型開發框架的價值是什么? SDK:Software Development Kit,它是一組軟件工具和資源的集合,旨在幫助開發者創建、測試、部署和維護應用程序或軟件。 所有開發框架(SDK)的核心價值,都是降低開發、維護成本。 大語言模型開發框架的價值,是讓開發者可以更方便地…

【linux命令】git命令簡單使用

git命令簡單使用 1. 將代碼下載到到本地2. 查看分支是否正確3. 將工作目錄中的變更添加到暫存區,為下一次提交做準備4. 提交更改,添加提交信息5. 將本地的提交推送到遠程倉庫6.從遠端倉庫拉取分支代碼7.查看修改日志8. 解決沖突 1. 將代碼下載到到本地 …

debian系統redis-dump安裝

1. ?Ruby 環境? Redis-dump 是一個 Ruby 工具,需先安裝 Ruby 和 RubyGems。 安裝命令?: sudo apt update sudo apt install ruby-full build-essential[roota29d39f5fd10:/opt/redis-dump/bin# apt install ruby-full build-essential Reading pac…

微軟押注“代理式AI網絡”:一場重塑軟件開發與工作方式的技術革命

在 2025 年 Build 開發者大會上,微軟正式發布了其面向“開放代理式網絡(Open Agentic Web)”的宏大戰略,推出超過 50 項 AI 相關技術更新,涵蓋 GitHub、Azure、Windows 和 Microsoft 365 全線產品。這一系列更新的核心…