數倉技術hive與oracle對比(一)

準備

包括軟硬件環境、數據、測試數據三方面的準備內容。

環境

虛擬機軟件virtualbox7,同樣的虛擬機配置:內存2G、cpu一核,物理主機同一臺macbookpro(13-2020款),所以硬盤IO讀寫速度一致。

綜上:hive環境與oracle環境是同樣的cpu、內存、硬盤、帶寬配置。

數據

使用倉庫、組織、物料、庫存流水,進行響應測試,oracle使用dbeaver等將測試數據從外系統加載至測試環境,hive使用sqoop將測試數據從外系統加載至測試環境。

hive中,表名、列名是不區分大小寫的,但庫名區分大小寫。oracle中,表名、列名、庫名均不區分大小寫。

測試數據的加載,按照oracle、hive的不同,分別采用不同的方式和工具進行處理。建表、導入數據并記錄導入數據所消耗時間。

oracle加載數據統計表

序號

方式

數據量

耗時

1

T_OD_BD_STORDOC

dbeaver

65

0.67s

2

T_OD_ORG_ORGS

dbeaver

1042

15s

3

T_OD_BD_MATERIAL

sqlplus

42388

5m39s

4

T_OD_IC_FLOW

存儲過程

193537

1m52s

備注:1、數據量超達到4萬條,dbeaver客戶端加載數據明顯慢很多,受限于客戶端工具(客戶端工具是java所開,需要將sql文件在工具中打開),改為使用服務端加載。

2、ic_flow 無法使用sqlplus這種方式,因為其導出的insert批量文件,文件中的insert語句超過sqlplus最大輸入范圍,改為使用存儲過程。

hive加載數據統計表

序號

方式

數據量

耗時

1

HT_OD_BD_STORDOC

sqoop

65

0.54s

2

HT_OD_ORG_ORGS

sqoop

1042

3.08s

3

HT_OD_BD_MATERIAL

sqoop

42388

3.49s

4

HT_OD_IC_FLOW

sqoop

193537

3.73s

測試數據

hive使用hplsql循環導入T_OD_IC_FLOW_10百萬行、T_OD_IC_FLOW_100千萬行數據時,系統報錯,java虛擬機崩潰。最后計劃使用T_OD_IC_FLOW中數據向T_OD_IC_FLOW_10手動加載10次,完成T_OD_IC_FLOW_10的數據導入,也不成功,遂放棄。

最終測試數據表統計如下。

表名

數據量

占用空間

oracle

hive

oracle

hive

T_OD_BD_STORDOC

HT_OD_BD_STORDOC

65

45

0.0625M

0.0183M

T_OD_ORG_ORGS

HT_OD_ORG_ORGS

1042

130

0.6875M

0.6168M

T_OD_BD_MATERIAL

HT_OD_BD_MATERIAL

42388

86

20M

19.62M

T_OD_IC_FLOW

HT_OD_IC_FLOW

193537

166

232M

208.77M

T_OD_IC_FLOW_10

HT_OD_IC_FLOW_10

1935370

166

2304M

T_OD_IC_FLOW_100

HT_OD_IC_FLOW_100

19353700

166

22733M

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/62534.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/62534.shtml
英文地址,請注明出處:http://en.pswp.cn/web/62534.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AR眼鏡_消費級工業AR智能眼鏡主板硬件解決方案

AR眼鏡的研發是一項復雜的軟硬件集成工程,它需要在攝影、音頻、交互和連接等多個方面提供卓越的基礎體驗,因此產品的每個細節都顯得尤為重要。 在設計AR眼鏡時,重量、體積和散熱性能都是必須認真考量的關鍵因素。在芯片平臺的選擇上&#xff…

通信原理概論復習筆記(1)

1 緒論 消息: 通信系統傳輸對象, 信息的載體和物理表現形式. 信息: 消息的有效內容和內涵. 信號: 消息的傳輸載體. 模擬通信: 信源 → \to → 調制器 → \to → 信道(噪聲) → \to → 解調器 → \to → 信宿. 數字通信: 信源 → \to → 信源編碼(壓縮數字化) → \to →…

ASPICE評估如何優化軟件開發、測試和部署流程

ASPICE(Automotive SPICE,即汽車軟件過程改進及能力評定)評估在提高軟件開發、測試、部署的速度和質量方面發揮著重要作用。以下是ASPICE評估如何具體提高這些環節的具體方式: 一、提高軟件開發效率 標準化流程:ASPIC…

【OpenCV】Canny邊緣檢測

理論 Canny 邊緣檢測是一種流行的邊緣檢測算法。它是由 John F. Canny 在 1986 年提出。 這是一個多階段算法,我們將介紹算法的每一個步驟。 降噪 由于邊緣檢測易受圖像中的噪聲影響,因此第一步是使用 5x5 高斯濾波器去除圖像中的噪聲。我們在前面的章…

Ubuntu 安裝 web 服務器

安裝 apach sudo apt install apache2 -y 查看 apach2 版本號 apache2 -v 檢查是否啟動服務器 sudo service apache2 status 檢查可用的 ufw 防火墻應用程序配置 sudo ufw app list 關閉防火墻 sudo ufw disable 更改允許通過端口流量 sudo ufw allow Apache Full 開啟…

如何落地文件即服務?--- 基于makeself封裝服務并啟動

我通常想能不能給客戶一個文件,然后客戶通過執行這個簡單的指令就可以吧,一個服務在本地起來? 這是一種文件即服務的思想,不知道你有沒有類似的想法,當我發現https://makeself.io/ ,我覺得它能很好的解決我…

mysql集群MHA方式部署

1. 基本信息 部署機器角色部署路徑192.168.242.71MySQL-Mater MHA-NodeMySQL: /alidata1/mysql-5.7.43192.168.242.72MySQL-Slave MHA-NodeMHA-Node: /alidata1/admin/tools/mha4mysql-node-0.58192.168.242.73MySQL-Slave MHA-Node192.168.242.74MHA-ManagerMHA-Manager: …

【C++】8___繼承

目錄 一、基本語法 二、繼承方式 三、對象模型 四、繼承中的構造與析構的順序 五、繼承中同名成員處理 六、多繼承語法 七、菱形繼承 一、基本語法 好處:減少重復的代碼 語法: class 子類 : 繼承方式 父類 子類 也稱為 派生類 父類…

Netty客戶端接收不到服務端發送的數據問題

文章目錄 前言問題描述相關代碼解決方法 前言 環境 JDK:64位 jdk1.8.0_201 Netty:4.1.39.Final 問題描述 項目中使用Netty接受客戶端的消息,客戶端為硬件設備,在接受數據后發送數據到服務端。 同時因為客戶端沒有聯網&#xff…

IDEA方法注釋模板設置

目錄 創建模板 新建模板:命名為* 設置模板內容-IDEA格式模板 設置模板應用場景 設置參數 創建模板 /**Enter這里我們也按照這種習慣來設置IDEA的方法注釋:File-->Settings-->Editor-->Live Templates 先新建模板組,然后在模板組中…

vscode 配置C/C++環境控制臺參數

您可以通過以下步驟在VS Code中配置C/C環境的控制臺參數: 1,打開VS Code并進入您的C/C項目 2,點擊左側的"調試"圖標,然后點擊頂部的齒輪圖標,選擇“launch.json”。 3,在"launch.json&qu…

深度學習筆記之BERT(五)TinyBERT

深度學習筆記之TinyBERT 引言回顧:DistilBERT模型TinyBERT模型結構TinyBERT模型策略Transformer層蒸餾嵌入層蒸餾預測層蒸餾 TinyBERT模型的訓練效果展示 引言 上一節介紹了 DistilBERT \text{DistilBERT} DistilBERT模型,本節將繼續介紹優化性更強的知…

正則表達式——參考視頻B站《奇樂編程學院》

智能指針 一、背景🎈1.1. 模式匹配🎈1.2. 文本替換🎈1.3. 數據驗證🎈1.4. 信息提取🎈1.5. 拆分字符串🎈1.6. 高級搜索功能 二、原料2.1 參考視頻2.2 驗證網址 三、用法3.1 限定符3.1.1 ?3.1.2 *3.1.3 3.1.…

appium學習之二:adb命令

1、查看設備 adb devices 2、連接 adb connect IP:端口 3、安裝 adb install xxx.apk 4、卸載 adb uninstall 【包名】 5、把對應目錄下的1.txt文件傳到手機sdcard下 adb push 1.txt /sdcard 6、進入對應的設備里 adb shell 7、切入sdcard目錄 cd /sdcard 8、ls 查…

Tablesaw封裝Plot.ly實現數據可視化

上文介紹tablesaw的數據處理功能,本文向你展示其數據可視化功能,并通過幾個常用圖表示例進行說明。 Plot.ly包裝 可視化是數據分析的重要組成部分,無論你只是“查看”新數據集還是驗證機器學習算法的結果。Tablesaw是一個開源、高性能的Java…

Python實現中國象棋

探索中國象棋 Python 代碼實現:從規則邏輯到游戲呈現 中國象棋,這款源遠流長的棋類游戲,承載著深厚的文化底蘊與策略智慧。如今,借助 Python 與 Pygame 庫,我們能夠在數字世界中復刻其魅力,深入探究代碼背后…

互聯網、物聯網的相關標準

互聯網的相關標準 網絡通信協議: HTTP(Hypertext Transfer Protocol):用于在網絡中傳輸文本、圖像、音頻和視頻等數據的協議。它基于請求-響應模型,客戶端發送請求給服務器,服務器返回響應。HTTPS&a…

學習Ajax (概述,應用場景,使用jQury 實現ajax)

目錄 前言 概述 什么是Ajax? 同步交互與異步交互的區別是什么呢? 應用場景 場景1 在搜索框搜索 資源 場景2 登錄業務的對用戶名處理 AJAX的優缺點 優點: 缺點: 使用jQury 實現ajax 使用步驟 1 引入jQury 文件 2 使用Ajax 函數…

網迅通推出新一代智能家居拓展網關

Zigbee 型智能家居拓展網關 產品概述 A、概述 Zigbee 是一種短距離、低功耗的無線通信技術名稱。其特點是近距離、低復雜度、低功耗、低數據速率、低成本。ZigBee 模塊是一種物聯網無線數據終端,利用 ZigBee 網絡為用戶提供無線數據傳輸功能。該產品采用高性能的…

ArcGIS字符串補零與去零

我們有時候需要 對屬性表中字符串的補零與去零操作 我們下面直接視頻教學 下面看視頻教學 ArcGIS字符串去零與補零 推薦學習 ArcGIS全系列實戰視頻教程——9個單一課程組合 ArcGIS10.X入門實戰視頻教程(GIS思維) ArcGIS之模型構建器(Mod…