步驟一:將excel另存為txt文檔(文本文件(制表符分割))假設名字為CompanyCode.txt
步驟二,將該txt文件導入Linux指定目錄中
步驟三,轉換編碼格式,在指定目錄下執行如下命令:piconv -f gb2312 -t UTF-8 CompanyCode.txt ?> ?c.txt
步驟四,根據文檔中的列,創建表,建表語句如下:
hive> create table CompanyCode (
> CCN String,
> Subsidiary String,
> SaleArea String,
> region String,
> CorporateName String,
> CorporateNameIT String,
> Remarks String)
> ROW format delimited
> fields terminated by '\t'
> STORED AS TEXTFILE;
步驟五:將c.txt文件加載到hive表CompanyCode中
hive> load data local inpath '/home/hadoop/c.txt' into table CompanyCode;
Loading data to table default.companycode
Table default.companycode stats: [numFiles=1, totalSize=3711]
OK
Time taken: 0.826 seconds
步驟六:驗證
hive> select * from CompanyCode;
注意觀察: 1. 驗證數據是否上傳成功 2. 若沒有數據,查看所有數據是否都保存在第一列 3. 有數據,是否正常,是否出現串列現象