Oceanbase下使用TPC-H模式生成數據

1.下載tpc-h

http://www.tpc.org/

點擊下載始終彈出這個畫面,嘗試了多種方法無效,最后選擇科學上網工具,才正常下載。

通過網盤分享的文件:TPC-H-Toolv3.zip
鏈接: https://pan.baidu.com/s/14CXrp7v_7XkPtXfFLkziBQ?pwd=qf5t 提取碼: qf5t?
--來自百度網盤超級會員v8的分享

2. 編譯TPCH基準工具

直接解壓安裝包TPC-H-Tool.zip

編輯項目定義的頭文件TPC-H V3.0.1/dbgen/tpcd.h,不同的數據庫使用不用的定義。文件中內置了一些數據庫,本示例使用obmysql,所以選擇添加mysql定義,如下:

#ifdef MYSQL

#define GEN_QUERY_PLAN? ""

#define START_TRAN????? "start transaction"

#define END_TRAN??????? "commit"

#define SET_OUTPUT????? ""

#define SET_ROWCOUNT??? "limit %d;\n"

#define SET_DBASE?????? "use %s;\n"

#endif

2.2. 修改編譯文件

編譯文件?TPC-H V3.0.1/dbgen/makefile.suite,找到如下內容按情況修改,CC行添加gcc、DATABASE/MACHINE/WORKLOAD添加參數,如下:
################

## CHANGE NAME OF ANSI COMPILER HERE

################

CC????? = gcc ???????

DATABASE= MYSQL

MACHINE = LINUX

WORKLOAD = TPCH

2.3. 執行編譯

上述2個文件配置完成后,TPC-H V3.0.1/dbgen/ 執行 make 命令(gcc提前安裝好)

編譯完成后會自動生成2個執行文件

  • dbgen:生成表數據(csv文件)
  • qgen:生成復雜查詢SQL

2.4 生成數據

在dbgen目錄下,使用如下命令生成.tbl數據文件。在本例中,-s 1表示生成1GB的數據。如果需要生成10GB的數據,將1改為10即可。

./dbgen -s 1

執行上述命令后,dbgen工具將開始生成數據文件并保存在當前目錄下。生成的數據文件包括8個表,分別是:supplier.tbl、region.tbl、part.tbl、partsupp.tbl、orders.tbl、nation.tbl、lineitem.tbl、customer.tbl。

2.5 obloader導入數據

[root@ocp dbgen]# /root/ob-loader-dumper-4.3.4-RELEASE/bin/obloader -h 192.192.103.125 -P2883 -uroot@test#test_ob_cluster -p 'Root_1234'? -D obcp4 --cut --all? -f '/root/ob-loader-dumper-4.3.4-RELEASE/ext' --file-suffix 'tbl' --thread 8

2025-09-17 20:44:29 [INFO] Parsed args:

[--cut] true

[--file-path] /root/ob-loader-dumper-4.3.4-RELEASE/ext

[--file-suffix] tbl

[--thread] 8

[--host] 192.192.103.125

[--port] 2883

[--user] root@test#test_ob_cluster

[--password] ******

[--database] obcp4

[--sys-user] root

[--all] true

初次導入報錯,檢查ob-loader-dumper.bad日志,發現字段的包裹符為|,同時行記錄結尾也有|,需要屏蔽掉,添加參數-trail-delimiter

[root@ocp dbgen]# /root/ob-loader-dumper-4.3.4-RELEASE/bin/obloader -h 192.192.103.125 -P2883 -uroot@test#test_ob_cluster -p 'Root_1234'? -D obcp4 --cut --all? -f '/root/ob-loader-dumper-4.3.4-RELEASE/ext' --column-separator '|' --file-suffix 'tbl' --thread 8 -trail-delimiter

其他用法參考文檔:

https://www.hikunpeng.com/document/detail/zh/kunpengdbs/testguide/tstg/kunpengtpch_02_0005.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/98280.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/98280.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/98280.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LeetCode 面試經典 150_哈希表_單詞規律(41_290_C++_簡單)

LeetCode 面試經典 150_哈希表_單詞規律(41_290_C_簡單)題目描述:輸入輸出樣例:題解:解題思路:思路一(哈希表):代碼實現代碼實現(思路一(哈希表&a…

librespeed c++ 上傳下載帶寬測試 排坑全流程

在搭建 LibreSpeed 測速服務并實現基于 curl/API 的上傳下載測試時,遇到 Nginx 配置沖突、PHP 權限異常等問題。本文將梳理從環境搭建到功能驗證的全流程,針對 “curl 上傳報 404/405”“PHP-FPM 權限拒絕”等典型問題,提供可復現的解決方案。…

重讀生成概率模型1----基礎概念

1 KL 散度 KL 散度的作為是描述兩個分布的差異的,首先是度量一個分布,用熵來度量。 1.1 熵 在介紹熵之間,首先要度量單個事件的信息量 I(x)?logP(x)I(x)-logP(x)I(x)?logP(x) 整體的信息量 H(P)Ex P[?logP(x)]?∑P(x)logP(x) \begin{alig…

排查解決磁盤占用高問題(容器掛載的磁盤)

最近遇到磁盤占用高的告警,記錄一下解決的思路。 首先是系統觸發告警,通知我們某臺機器磁盤占用高。(或其他途徑得知) 通過XShell登錄該機器。 執行df-h命令查看掛載占用情況找到真正占用高的掛載點掛載點/home目錄占用高&#xf…

流體(1)

流體 Minecraft 中的流體(Fluid),也常被稱為液體(Liquid),是一類能夠自由流動、形成河流、瀑布或湖泊的特殊方塊。它們的行為基于簡化的流體力學,是游戲世界中動態環境的重要組成部分。 ?? 流體是什么? 在 Minecraft 中,流體核心特點包括: 源方塊與流動:每個流…

機器學習-卷積神經網絡(CNN)

全連接層->卷積層 用有一個隱藏層的MLP訓練ImageNet數據集(300*300的圖像,有1000個類別),要有10000個輸出 會有10億個可學習的參數,量太大 全連接:一個輸出是根據所有輸入加權得到在圖片中識別物體&…

Ubuntu 磁盤擴容與擴容失敗問題解決( df -h 與 GParted 顯示空間不一致的問題 -LVM)

在管理 Linux 磁盤時,你是否遇到過這樣的困惑:正常擴容之后,發現GParted 顯示某個分區還有幾十 GiB 可用,但 df -h 卻提示該分區已接近滿額?這種 “空間幻覺” 背后是系統存儲管理的分層設計,本文將從原理到…

PyQt5中QLineEdit控件數值顯示與小數位數控制

在PyQt5應用程序開發中,QLineEdit控件常用于顯示和編輯文本內容。當需要用它來顯示數值并控制小數位數時,開發者需要掌握一些特定的技巧。本文將深入探討幾種實現方法,每種方法都附帶完整獨立的代碼示例。 數值格式化基礎 在Python中&#xf…

LangChain使用方法以OpenAI 的聊天模型GPT-4o為例

以使用 OpenAI 的聊天模型(如 GPT-4)為例,從設置環境、初始化模型、調用模型到處理響應的各個方面進行介紹: 1. 環境設置 安裝 langchain-openai 包。設置環境變量 OPENAI_API_KEY,用于認證(以linux為例&am…

Oracle為數據大表創建索引方案

在日常業務中,避免不了為數據量大表補充創建索引的情況,如果快速、有效地創建索引成了一個至關重要的問題(注意:雖然提供有ONLINE在線執行的方式,理想狀態下不會阻塞DML操作,但ONLINE在開始、結束的兩個時刻…

網站服務相關問題

目錄 HTTP常見的狀態碼 http和https的區別以及使用的端口號 http處理請求的過程 https認證過程 正向代理和反向代理的區別 HTTP常見的狀態碼 HTTP(超文本傳輸協議)定義了一系列的狀態碼,用于表示客戶端請求的處理結果。以下是一些常見的…

Go并發編程實戰:深入理解Goroutine與Channel

Go并發編程實戰:深入理解Goroutine與ChannelGo并發編程實戰:深入理解Goroutine與Channel概述1. 為什么是Go的并發?從“線程”與“協程”說起2. Goroutine:如何使用?3. Channel:Goroutine間的安全通信創建與…

2025服貿會“海淀之夜”,點亮“科技”與“服務”底色

2025年9月12日傍晚,北京頤和園,十七孔橋旁,2025年中國國際服務貿易交易會“海淀之夜”如約而至。在“海淀之夜”,科技機構、金融機構、咨詢服務機構、出海服務企業以及跨國企業和國際友人等,將目光聚焦于此。被第三方機…

qt使用camke時,采用vcpkg工具鏈設置VTK的qt模塊QVTKOpenGLNativeWidget

下載:QVTKOpenGLNativeWidget嵌入qt應用中資源-CSDN下載 1.通過vcpkg安裝VTK,目前的VTK里面默認為qt6,如果需要安裝qt5,需要將端口配置進行修改 筆者的vcpkg的vtk端口路徑:D:\vcpkg\ports\vtk portfile.cmake 修改點: #第一處 #file(READ "${CURRENT_INSTALLED_DIR}/sh…

Axios在鴻蒙應用開發中的使用

目錄一、簡介二、安裝與配置三、axios用法1.axios泛型參數(1).第三個泛型參數-約束data請求參數的類型(2).第二個泛型參數-決定后臺返回數據的類型2.axios攔截器3.請求工具封裝統一處理業務狀態碼錯誤統一處理401或404錯誤一、簡介 Axios 是一個基于 Promise 的網絡請求庫&…

第九周文件上傳

文件上傳漏洞 不同的網站要不同的webshell。我們使用是php開發的網站。 一服務器白名單繞過 服務端白名單(Whitelist)是?種安全機制,它只允許預定義的合法元素通過(只有有限的元素進入),其他所有內容默認被拒絕。相比黑名單&am…

計算機視覺必讀論文:從經典到前沿

計算機視覺必讀論文:從經典到前沿 一、前言 二、經典論文解讀? 2.1 圖像分類? 2.1.1 《ImageNet Classification with Deep Convolutional Neural Networks》(AlexNet)? 2.1.2 《Very Deep Convolutional Networks for Large-Scale Image Recognition》(VGGNet)? 2.1.…

對比PowerBI的字段參數,QuickBI的已選字段還有改進的空間

對比PowerBI的字段參數,QuickBI的已選字段還有改進的空間 之前分享過QuickBI的已選字段 vs PowerBI的字段參數,QuickBI可以在表格中實現PowerBI的字段參數效果,甚至比PowerBI實現的過程和使用方式更絲滑。 但如果應用到圖形中會怎么樣呢&am…

飛算JavaAI:Java開發新時代的破曉之光

免責聲明:此文章的所有內容皆是本人實驗測評,并非廣告推廣,并非抄襲。如有侵權,請聯系,謝謝!【#飛算JavaAl炫技賽】 【#Java開發】摘要:飛算JavaAI作為全球首款聚焦Java的智能開發助手&#xff…

vulntarget-c靶場內網滲透

1. 環境搭建 2.對ubuntu20的滲透 對其進行端口掃描 訪問80端口 發現是laravel框架。版本是v8.78.1 使用 kaili 自帶的msf 進行滲透 search laravel use exploit/multi/php/ignition_laravel_debug_rce執行利用完成檢測 上傳木馬 先將木馬進行base64編碼 <?php eval($_P…