Hive分區
Hive組織表到分區。它是將一個表到基于分區列,如日期,城市和部門的值相關方式。使用分區,很容易對數據進行部分查詢。
表或分區是細分成桶,以提供額外的結構,可以使用更高效的查詢的數據。桶的工作是基于表的一些列的散列函數值。
例如,一個名為Tab1表包含雇員數據,如id,name,dept和yoj(加盟年份)。假設需要檢索所有在2012年加入,查詢搜索整個表所需的信息員工的詳細信息。但是,如果用年份分區雇員數據并將其存儲在一個單獨的文件,它減少了查詢處理的時間。下面的示例演示如何分區的文件和數據:
下面文件包含employee數據表。
/tab1/employeedata/file1
id, name, dept, yoj
1, gopal, TP, 2012
2, kiran, HR, 2012
3, kaleel,SC, 2013
4, Prasanth, SC, 2013
上面的數據被劃分成使用年兩個文件。
/tab1/employeedata/2012/file2
1, gopal, TP, 2012
2, kiran, HR, 2012
/tab1/employeedata/2013/file3
3, kaleel,SC, 2013
4, Prasanth, SC, 2013
添加分區
可以通過添加分區表改變所述表。假設我們有一個表叫employee,擁有如 Id, Name, Salary, Designation, Dept, 和 yoj等字段。
語法:
ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec
[LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;partition_spec:
: (p_column = p_col_value, p_column = p_col_value, ...)
以下查詢用于將分區添加到employee表。
hive> ALTER TABLE employee
> ADD PARTITION (year=’2013’)
> location '/2012/part2012';
重命名分區
此命令的語法如下:
ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;
以下查詢用來命名一個分區:
? ALTER TABLE employee PARTITION (year=’1203’) RENAME TO PARTITION (Yoj=’1203’);
刪除分區
下面語法用于刪除分區:
ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;
以下查詢是用來刪除分區:
ALTER TABLE employee DROP [IF EXISTS] PARTITION (yeat='1203');