Greenplum使用hbase外部表

概述

GP可以通過pxf協議上的hbase外表功能, 在數據庫中創建外部表,映射hbase table,以直接在gp中訪問 hbase數據,方便將hbase的查詢結果集保留在gp中

hbase端準備

HBase基礎概念:
?HBase 列包含兩個組件:列簇和列限定詞。 這些組件由冒號 : 分隔, :
?HBase 行由一個行鍵和一個或多個列值組成。 行鍵是表行的唯一標識符
?HBase 表是由具有一個或多個列的數據行組成的多維映射。 創建HBase表時,可以指定一組完整的列簇
?HBase 單元由行(列簇, 列限定詞, 列值)和時間戳組成。 給定單元格中的列值和時間戳表示該值的版本

示例: 創建一個HBase表

1.在 default 命名空間中創建一個名為 order_info 的HBase表。 order_info 具有兩個列簇: product 和 shipping_info:

hbase(main):> create 'order_info', 'product', 'shipping_info'

2.order_info product 列簇具有名為 name 和 location 的列標識符。shipping_info 列簇具有名為 state 和 zipcode 的列標識符。 將一些數據添加到 order_info 表中:

put 'order_info', '1', 'product:name', 'tennis racquet'
put 'order_info', '1', 'product:location', 'out of stock'
put 'order_info', '1', 'shipping_info:state', 'CA'
put 'order_info', '1', 'shipping_info:zipcode', '12345'
put 'order_info', '2', 'product:name', 'soccer ball'
put 'order_info', '2', 'product:location', 'on floor'
put 'order_info', '2', 'shipping_info:state', 'CO'
put 'order_info', '2', 'shipping_info:zipcode', '56789'
put 'order_info', '3', 'product:name', 'snorkel set'
put 'order_info', '3', 'product:location', 'warehouse'
put 'order_info', '3', 'shipping_info:state', 'OH'
put 'order_info', '3', 'shipping_info:zipcode', '34567'

在本主題后面的示例中,您將通過PXF直接訪問 orders_info HBase 表。

3.顯示 order_info 表的內容:

hbase(main):006:0> scan 'order_info'
ROW                                            COLUMN+CELL1                                             column=product:location, timestamp=1711619646590, value=out of stock1                                             column=product:name, timestamp=1711619646553, value=tennis racquet1                                             column=shipping_info:state, timestamp=1711619646608, value=CA1                                             column=shipping_info:zipcode, timestamp=1711619646624, value=123452                                             column=product:location, timestamp=1711619646653, value=on floor2                                             column=product:name, timestamp=1711619646639, value=soccer ball2                                             column=shipping_info:state, timestamp=1711619646667, value=CO2                                             column=shipping_info:zipcode, timestamp=1711619646680, value=567893                                             column=product:location, timestamp=1711619646710, value=warehouse3                                             column=product:name, timestamp=1711619646696, value=snorkel set3                                             column=shipping_info:state, timestamp=1711619646730, value=OH3                                             column=shipping_info:zipcode, timestamp=1711619625228, value=34567
3 row(s) in 0.0980 seconds

創建外表

  1. 創建語法:
CREATE EXTERNAL TABLE <table_name>( <column_name> <data_type> [, ...] | LIKE <other_table> )
LOCATION ('pxf://<hbase-table-name>?PROFILE=HBase')
FORMAT 'CUSTOM' (FORMATTER='pxfwritable_import');

<hbase?table?name> HBase表的名稱
PROFILE PROFILE 關鍵字必須指定為 HBase
SERVER=<server_name> PXF用于訪問數據的命名服務器配置。可選的; 如果未指定,PXF將使用default服務器。
FORMAT FORMAT 子句必須指定為 ‘CUSTOM’ (FORMATTER=‘pxfwritable_import’)

  1. 數據類型映射:
    HBase是基于字節的; 它將所有數據類型存儲為字節數組。 要在Greenplum數據庫中表示HBase數據,請為Greenplum數據庫列選擇與HBase列標識符值的底層內容匹配的數據類型。
    注意: PXF不支持復雜HBase對象

  2. 查詢測試

創建外表

CREATE EXTERNAL TABLE orderinfo_hbase ("recordkey" text,"product:name" varchar, "shipping_info:zipcode" int,"product:location" text,"shipping_info:state" int) LOCATION ('pxf://order_info?PROFILE=HBase') FORMAT 'CUSTOM' (FORMATTER='pxfwritable_import');

查詢

postgres=# select * from orderinfo_hbase_gwtest;recordkey |  product:name  | shipping_info:zipcode
-----------+----------------+-----------------------1         | tennis racquet |                 123452         | soccer ball    |                 567893         | snorkel set    |                 34567
(3 rows)

取全部字段:注意字段與hbase映射字段之間的字段類型關系:

postgres=# CREATE EXTERNAL TABLE gwtest02 ("recordkey" text,"product:name" varchar, "shipping_info:zipcode" text,"product:location" text,"shipping_info:state" text) LOCATION ('pxf://o
CREATE EXTERNAL TABLEpostgres=# select * from gwtest02;recordkey |  product:name  | shipping_info:zipcode | product:location | shipping_info:state
-----------+----------------+-----------------------+------------------+---------------------1         | tennis racquet | 12345                 | out of stock     | CA2         | soccer ball    | 56789                 | on floor         | CO3         | snorkel set    | 34567                 | warehouse        | OH

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/15881.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/15881.shtml
英文地址,請注明出處:http://en.pswp.cn/web/15881.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

粒子輻照環境中相機鏡頭防護及LabVIEW圖像處理注意事項

在粒子輻照環境測試電路板性能的實驗中&#xff0c;需要對相機鏡頭進行有效防護&#xff0c;同時利用LabVIEW進行圖像識別和處理。本文將討論相機鏡頭防護的關鍵因素和LabVIEW處理過程中的注意事項&#xff0c;包括防輻射材料選擇、輻射屏蔽措施、散熱管理、空間布局及LabVIEW軟…

c++11:左值引用和右值引用《全家桶》

總結一下C11中涉及到左值引用和右值引用的場景。 1 左值引用和右值引用的區別 左值引用 定義&#xff1a;對左值的引用。目的是避免內存拷貝&#xff0c;類似c中的指針,兩個場景&#xff1a;函數傳參、函數返回值。 右值引用 定義&#xff1a;對右值的引用。兩個場景&#…

【機器學習-k近鄰算法-01】 | Scikit-Learn工具包進階指南:機器學習sklearn.neighbors模塊之k近鄰算法實戰

&#x1f3a9; 歡迎來到技術探索的奇幻世界&#x1f468;?&#x1f4bb; &#x1f4dc; 個人主頁&#xff1a;一倫明悅-CSDN博客 ?&#x1f3fb; 作者簡介&#xff1a; C軟件開發、Python機器學習愛好者 &#x1f5e3;? 互動與支持&#xff1a;&#x1f4ac;評論 &…

騎行 - 新區永旺出發的環太湖路線

環過好幾次太湖&#xff0c;但對路線都沒太在意&#xff0c;都是跟著別人走的。這次自己制定一個路書&#xff0c;方便下次自己一個人環太湖時使用。 開始是使用高德地圖做路書&#xff0c;只能在PC上做。我用的是網頁版&#xff0c;每次選點太麻煩了。要輸入地址搜索&#xff…

開源博客項目Blog .NET Core源碼學習(27:App.Hosting項目結構分析-15)

本文學習并分析App.Hosting項目中后臺管理頁面的角色管理頁面。 ??角色管理頁面用于顯示、檢索、新建、編輯、刪除角色數據同時支持按角色分配菜單權限&#xff0c;以便按角色控制后臺管理頁面的菜單訪問權限。角色管理頁面附帶一新建及編輯頁面&#xff0c;以支撐新建和編輯…

電纜廠可視化:提升生產透明度與運營效率

圖撲電纜廠可視化系統通過實時監控和數據分析&#xff0c;提高生產過程的透明度和可控性&#xff0c;優化資源配置和質量管理&#xff0c;顯著提升運營效率和產品質量。

啟動SpringBoot項目及解決端口占用問題(指令版)

打包SpringBoot 項目 需要將 SpringBoot 項目進行打包。可以使用 Maven 的快捷工具&#xff0c;或者在項目的 pom.xml 文件所在目錄執行以下命令&#xff1a; mvn clean package部署注意 Windows系統下&#xff0c;按照以下方式在cmd窗口以管理員身份允許使用命令啟動spring…

Flutter 中的 StatefulBuilder 小部件:全面指南

Flutter 中的 StatefulBuilder 小部件&#xff1a;全面指南 在Flutter中&#xff0c;StatefulBuilder是一個高效的小部件&#xff0c;它根據給定的構建函數來構建widget&#xff0c;并在組件樹中只對需要重新構建的部分進行更新。這使得它在性能優化方面非常有用&#xff0c;特…

電子電器架構 - AUTOSAR ON THE AIR

電子電器架構 - AUTOSAR ON THE AIR 我是穿拖鞋的漢子,魔都中堅持長期主義的汽車電子工程師。 老規矩,分享一段喜歡的文字,避免自己成為高知識低文化的工程師: 屏蔽力是信息過載時代一個人的特殊競爭力,任何消耗你的人和事,多看一眼都是你的不對。非必要不費力證明自己…

Mybase長久破解

1、軟件下載好之后&#xff0c;找到文件mybase8.ini文件 2、使用記事本打開&#xff0c;通過 Ctrl F 輸入快速找到屬性設置FirstUseOn.UserLic.App&#xff0c;將等號后面的數值刪掉保存即可 3、使用防護中心–>自定義防護&#xff08;記得開啟&#xff09; 4、添加規則…

Golang文件操作

文章目錄 文件操作基本介紹普通的文件操作方式&#xff08;os包&#xff09;帶緩沖的文件操作方式&#xff08;bufio包&#xff09;文件拷貝操作&#xff08;io包&#xff09; 命令行參數基本介紹解析命令行參數&#xff08;flag包&#xff09; JSON基本介紹JSON序列化JSON反序…

【MySQL精通之路】MySQL的使用(3)-連接到服務器的配置

目錄 1.連接建立的命令選項 1.1.--default-auth 1.2.--hosthost_name, -h host_name 1.3.--password[pass_val], -p[pass_val] 1.4.--password1[pass_val] 1.5.--password2[pass_val] 1.6.--password3[pass_val] 1.7.--pipe, -W 1.8.--plugin-dirdir_name 1.9.--port…

【YOLOv10訓練】:報錯 AttributeError: ‘str‘ object has no attribute ‘view‘ 解決方法

YOLOv10訓練報錯 YOLOv10是在YOLOv8基礎上修改的&#xff0c;即&#xff1a;訓練方法和過程是相同的。 但按照v8訓練程序train.py&#xff0c;如下所示&#xff0c;直接訓練&#xff1a; from ultralytics import YOLO# Load a model model YOLO("ultralytics/cfg/mod…

真拿AI賺到錢的人,不在朋友圈里

1 最近有張兩大AI巨頭對比的梗圖給我看樂了&#xff0c;玩兒AI的還在做產品&#xff0c;玩兒焦慮的已經在數錢了。 這也是在做AI&#xff0c;只不過是唉聲嘆氣的ai。 要我說&#xff0c;現在缺的根本不是AI&#xff0c;而是【有用的AI】。 恩格斯老師說過一句話&#xff1a…

科林Linux6_網絡

#include<sys/socket.h> #include<arpa/inet.h> //大小端轉換 #include<netdb.h> //DNS一、Socket套接字 為了開發網絡應用&#xff0c;系統提供一套API函數接口&#xff0c;用于網絡應用開發&#xff0c;這些接口稱為套接字函數 struct sockaddr_in…

數據庫管理-第194期 網絡加速RDMA初探(20240526)

數據庫管理194期 2024-05-26 數據庫管理-第194期 網絡加速RDMA初探&#xff08;20240526&#xff09;1 概念2 發展3 使用總結 數據庫管理-第194期 網絡加速RDMA初探&#xff08;20240526&#xff09; 作者&#xff1a;胖頭魚的魚缸&#xff08;尹海文&#xff09; Oracle ACE A…

英文 海量的學習句子比單獨的記單詞效果要好,格句致知。

英文 海量的學習句子比單獨的記單詞效果要好 句子有上下文、場景和時態等&#xff0c;能形成劇情&#xff0c;變得生動有趣。 如果一句沒聽懂&#xff0c;還繼續聽就是浪費時間了。要一句一句地深究&#xff0c;不然就要讀好幾遍&#xff0c;還得背誦。要深入理解&#xff0c…

不同的二叉搜索樹(II)題解

toc &#x1f91a;我的博客 歡迎光臨我的博客&#xff1a;https://blog.csdn.net/qq_52434217?typeblog &#x1f95b;前言 動態規劃是常見的算法思路&#xff0c;動態規劃在計算過程中保存了部分計算結果到內存中&#xff0c;以便于在進行下一次計算時可以直接從內存中獲…

Ubuntu部署Dolphinscheduler單機版并配置PG數據庫

1、下載并解壓Dolphinscheduler DolphinScheduler | 下載 (apache.org) 下載完成后得tar.gz包 下載穩定版 下載穩定版 下載穩定版 tar -zxvf apache-dolphinscheduler-3.1.9-alpha-bin.tar.gz mv apache-dolphinscheduler-3.1.9-alpha-bin dolphinscheduler-bin cd dolph…

【Text2SQL】Spider 數據集

論文&#xff1a;Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task ????? EMNLP 2018, arXiv:1809.08887 Dataset: spider GitHub: github.com/taoyds/spider 一、論文速讀 本文提出了 Text2SQL 方向的…