Cloudera虛擬機配置(虛擬機環境自帶Hadoop、Impala等大數據處理應用)

????????上學期的大數據處理課程,筆者被分配到Impala的匯報主題。然而匯報內容如果單純只介紹Impala的理論知識,實在是有些太過膚淺,最起碼得有一些實際操作來展示一下Impala的功能。但是Impala的配置實在是有些困難與繁瑣,于是筆者通過各種渠道找到了Cloudera公司(Hadoop數據管理軟件與服務提供商)在早些年發行的虛擬機文件,通過配置該虛擬機可以直接獲得一個較為完整的大數據處理應用環境(包括Hadoop、Impala等數種大數據處理應用)。

【虛擬機文件資源已上傳百度網盤,沒辦法,這個虛擬機文件實在是太大了(5+G),要不然我就直接在博客上資源綁定了】

鏈接:https://pan.baidu.com/s/1hRhJySvZTqmxUvqZJ3tYuQ?pwd=a6t3?
提取碼:a6t3?
?

虛擬機軟件

? ? ? ? 筆者使用的虛擬機軟件是Oracle VM VirtualBox(圖標如下),關于該軟件的詳細安裝步驟請恕筆者不在此贅述,直接進入配置階段。

?配置cloudera-quickstart虛擬機

將文件夾全部下載下來后,文件夾里應該有這兩個文件,不能有缺漏。

確認無誤后,打開虛擬機,導入該虛擬機文件,如下圖。

在下列劃橫線處選擇下載好的虛擬機文件路徑

(選擇圖標為黃色方塊的那個文件,文件格式為ovf)

進入下一步,該頁面全部采用默認設置即可👇?

設置完成后,點擊導入即可在虛擬機首頁看到虛擬機文件。但此時還不能直接運行,因為該虛擬機對于內存和顯存都有一定要求,必須進行額外的設置才能滿足虛擬機運行的條件,筆者嘗試了一種可正常運行的設置方案如下:

首先點擊設置

在“系統-主板”選項中,將內存改為7500MB(也可以再稍微調大一些,根據實際情況來)

在“系統-處理器”界面,將“處理器數量”更改為4個。

在“顯示-屏幕”選項中,將“顯存大小”更改為28MB
完成如上設置后,點擊運行虛擬機,一般情況下即可正常完成運行。虛擬機的啟動過程比較緩慢,需要耐心等待,啟動成功后虛擬機如下圖所示。該虛擬機中基本包含了大數據處理的所有基本應用(包括Hadoop、Impala、Hive等),虛擬機的操作系統是Red Hat,跟Ubuntu差不多,啟動這些應用可以直接通過終端命令行進行操作。?

實操應用

本部分主要對Impala的大數據處理操作進行一些實操演示,并將其與Hive進行一個簡單對比。

Impala適用于處理在Hadoop集群中的大量數據的MPP(大規模并行處理)SQL查詢引擎。它是一個用C++和Java編寫的開源軟件。與其他Hadoop的SQL引擎相比,它提供了高性能和低延遲。

簡而言之,它提供了訪問存儲在Hadoop分布式文件系統中的數據的最快方法。但是Impala只能處理PB級別的數量級,更大數量級的數據處理起來性能很差。它的主要應用在于處理實時數據、進行交互計算。

接下來進行Impala的相關操作

首先啟動Impala,如下在命令行中直接輸入“impala-shell”。

Impala的控制語句和數據庫的控制語句基本相同,以下演示幾個基本命令。

【創建數據庫】

【向表格中插入數據】

在Impala中的相關操作,都可以在虛擬機中自帶的Hue中進行可視化數據查看,如下展示了筆者通過Impala插入了若干數據后查看的結果。

為了更好地理解Impala”快“的特點,筆者簡單插入了20個數據,并將impala和hive進行取數據的時間對比,比較兩者的速度差異。(左側為hive,右側為impala)

筆者進行多次操作確保時間達到相對穩定的值,可以看到,在較少樣本的情況下,impala仍然能比hive快0.06s。

當然以上的對比差異可能不夠顯著,主要是因為樣本的數量實在過少,但是根據筆者搜索到的一個大樣本數據測試顯示,impala在實時處理、交互計算方面確實存在明顯的優勢。


以上就是本篇博客的全部內容,歡迎大家下載資源進行測試。cloudera的虛擬機文件近年來已經不再發行了,本篇博客中的虛擬機文件差不多算是絕品了,筆者當時能找到這個文件真的是費勁了九牛二虎之力啊,實屬不易~果然做研究是必須要下大功夫的!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/712703.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/712703.shtml
英文地址,請注明出處:http://en.pswp.cn/news/712703.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uni-app去除頁面頭部的標題欄

uniapp項目 每個界面都會有一個標題欄 配置在我們項目根目錄的 pages.json中 我們將它全部去掉 上面還是有一條黑的 體驗非常差 我們只需要在pages.json中 指定page的 style中加入 "navigationStyle": "custom"對應的page 就沒有這個標題欄了

【王道數據結構】【chapter8排序】【P371t6】

試設計一個算法&#xff0c;判斷一個數據序列是否構成一個小根堆&#xff08;下面代碼中的堆排序的部分僅僅是為了方便設計測試用例&#xff09; #include <iostream> #include<time.h> #include<stdlib.h>int * buildarray(int size) {int* tmp(int *) mall…

藍橋杯備賽第四篇(高級數據結構)

1.樹狀數組 public static int getSum(int i) {int sum 0;for (int j i; j > 1; j - lowbit(j)) {sum tree[j];}return sum;}public static void update(int i, int update) {for (int j i; j < n; j lowbit(j)) {tree[j] update;}}public static int lowbit(int n…

00x集體——cad 中DB(database)對象—— vba實現

Database 對象 外部參照塊的內容。 VBA 類名 AcadDatabase 創建方法 不可使用 訪問途徑 Block.XRefDatabase 該對象提供對外部參照塊的訪問。只有IsXRef屬性為TRUE的塊才適用。 方法 CopyObjects 屬性 Application Blocks Dictionaries DimStyles Ele…

Mybatis 主從表有名字相同,只能查詢出一條數據

Mybatis 主從表有名字相同&#xff0c;只能查詢出一條數據 重新命名后&#xff0c;可以正常查詢

力扣SQL50 使用唯一標識碼替換員工ID 查詢

Problem: 1378. 使用唯一標識碼替換員工ID 思路 left join&#xff1a;左連接 Code select eu.unique_id,e.name from Employees e left join EmployeeUNI eu # left join 左連接 on e.id eu.id;

勒索病毒防范建議——企業緩解措施

勒索病毒防范建議——企業緩解措施 為公司的作業系統和應用程序保持為更新版本。 應用最新的安全補丁&#xff0c;確保關鍵軟件是最新的&#xff0c;移動設備亦一樣。可以的話&#xff0c;啟用自動更新選項。 定時更新將確保設備更安全&#xff0c;性能亦更好。評估是否需要安…

零基礎小白到底適不適合學鴻蒙,請看完這篇再決定吧~

隨著華為鴻蒙系統的問世&#xff0c;不少技術小白在是否學習鴻蒙的問題上猶豫不決。鴻蒙作為華為自主研發的操作系統&#xff0c;擁有許多獨特的技術優勢和市場前景。但對于小白來說&#xff0c;是否值得投入時間和精力去學習鴻蒙開發呢&#xff1f; 1.鴻蒙系統開發&#xff1…

【總結】對大量函數進行trace調用流程+國際AIS3題

現在混淆的主要目的之一就有讓逆向分析人員不清楚函數的調用流程&#xff0c;給你一堆函數&#xff0c;加了高強度的OLLVM&#xff0c;更不能看了。那么Trace跟蹤技術就顯得很重要的&#xff0c;如果清楚了函數調用流程&#xff0c;那么逐個分析&#xff0c;距離成功不就很快了…

前段時間公司招人,面了一個要20K的,一問自動化只會點皮毛···

前段時間公司要招2個自動化測試&#xff0c;同事面了幾十個候選人&#xff0c;發現了一個很奇怪的現象&#xff0c;面試的時候&#xff0c;如果問的是框架api、腳本編寫這些問題&#xff0c;基本上個個都能對答如流&#xff0c;等問到實際項目的時候&#xff0c;類似“怎么從0開…

Spring - InitializingBean、@PostConstruct、@Bean(initMethod = “init“)和構造方法執行優先級比較

執行順序優先級 構造方法 > postConstruct > afterPropertiesSet > init方法 代碼案例 Component public class InitializingBeanTest implements InitializingBean {public InitializingBeanTest(){System.out.println("構造方法");}Overridepublic void…

《滴滴》24校招Java后端

1.問項目 2.Java的基本數據類型&#xff1f; 3.浮點型從二進制的視角是怎么存儲的&#xff1f;&#xff08;IEEE 754&#xff09;小數位如何計算出來的&#xff1f; 4.浮點型的正4.5和負4.5轉為int會怎么樣&#xff1f; 5.Int型999除float的100再乘100結果&#xff1f; 6.Strin…

實現窗簾系統監控功能-代碼實現

自定義監控指標是實現窗簾系統監控功能的關鍵一步。這通常涉及到你想要跟蹤和衡量的系統特定方面的數據。以下是一些步驟和考慮因素&#xff0c;可以幫助你自定義監控指標&#xff1a; 1.明確監控目標&#xff1a; 確定你想要監控的窗簾系統的具體方面。這可能包括窗簾的開關狀…

基于yolov8的半自動標注

一、前言介紹 在深度學習領域中&#xff0c;標注是一項非常重要的工作&#xff0c;因為許多深度學習模型都依賴于有標注的數據進行訓練。然而&#xff0c;標注數據是一個費時費力的工作&#xff0c;因此人們希望有一種方式來對標注過程進行自動化。這就是“半自動標注”的來源…

Linux入門攻堅——16、Linux系統啟動流程

CentOS5、6的啟動流程 Linux&#xff1a;kernel rootfs&#xff0c;Linux系統就是內核加上根文件系統。 內核之上是庫&#xff1a; 庫&#xff1a;函數集合&#xff0c;function&#xff0c;函數具有調用接口&#xff0c;庫函數不能單獨執行&#xff0c;必須被其他程序調用…

【前端素材】推薦優質在線電影院商城電商網頁Hyper平臺模板(附源碼)

一、需求分析 1、系統定義 在線電影商城是指一個通過互聯網提供電影服務的平臺&#xff0c;用戶可以在該平臺上瀏覽電影資源、租借或購買電影&#xff0c;以及觀看在線影片。 2、功能需求 在線電影商城是指一個通過互聯網提供電影服務的平臺&#xff0c;用戶可以在該平臺上…

四川尚熠電子商務有限公司電商服務領域的佼佼者

在數字化浪潮席卷全球的今天&#xff0c;電子商務已成為推動企業轉型升級、拓展市場渠道的重要力量。四川尚熠電子商務有限公司&#xff0c;作為一家專注于抖音電商服務的公司&#xff0c;憑借其獨特的服務模式和創新的營銷策略&#xff0c;在激烈的市場競爭中脫穎而出&#xf…

Linux 系統安裝/卸載 Nginx教程

優質博文&#xff1a;IT-BLOG-CN 一、安裝Nginx 【1】首先通過Nginx官網確定需要安裝的版本&#xff0c;如果Linux聯網則直接在Linux服務上使用wget命令將Nginx安裝包下載到/usr/local/目錄下&#xff1a; [rootxxx local]# wget -c http://nginx.org/download/nginx-1.22.1.…

【C++精簡版回顧】14.(重載2)流重載

1.流重載 istream ostream 1.class class MM {friend ostream& operator<<(ostream& out, MM& mm);friend istream& operator>>(istream& in, MM& mm); public:MM() {}MM(int age,string name):age(age),name(name) {} private:int age;st…

Three.js-05坐標軸AxesHelper

1.構建對象 說明&#xff1a;參數一表示坐標軸的長度。紅色代表 X 軸. 綠色代表 Y 軸. 藍色代表 Z 軸. const axesHelper new THREE.AxesHelper( 1 ); 2.設置位置 axesHelper.position.y1 axesHelper.position.x1 axesHelper.position.z1 3. 網格 說明&#xff1a;立方體…