最近一個項目,關于大數據的改造項目,底層選擇Impala還是sparkSQL呢?
最后選擇Impala.這樣就開啟了我的Impala學習之旅。我大部分負責Imapa接口開發工作。
我是控制不住的想整個都了解和學習。所有還在impala控制臺各種測試和學習。差不多一兩天就熟悉了基本的命令。
開發之前需要做很多準備工作。首先得造一個500w的測試數據啊。
在impala中造數據肯定是不方便的,所有在oracle中造數據。寫存儲過程跑sql。在oracle中造好了數據,就要導入到IMPALA中。
這下用接觸到Sqoop導入工具,學習真的是永遠學習不玩啊。
。。。接下來就是折騰導數據過程。。。寫接口。。。各種測試。。。
不想寫了,下篇博客寫些impala基本操作命令吧。主要是工作中常用的。有時間貼一個小demo出來。方便大家上手。
?