hive2知识点总结
1. hive配置文件
1 | /etc/hive/2.6.4.0-91/0 |
2. hive2启动
1 | hive |
3. hive2查看外部表还是内部表
1 | 方法一:describe extended 表名; |
4. 内部表
4.1 建立
1 | create table if not exists 表名 |
4.2 导入数据
1
2
3
4 目标文件的格式:‘utf-8’
load data [local] inpath '目标文件' [overwrite] into table 表名 [partition (partcloo=vall)]
示例:
load data local inpath '/root/hive2_file/in_table.txt' overwrite into table in_table;
4.3 删除该表
1 | drop table 表名; |
5. 外部表
5.1 建表
1 | create external table if not exists 表名 |
5.2 导入数据
1
2
3
4 目标文件的格式:‘utf-8’
load data [local] inpath '目标文件' [overwrite] into table 表名 [partition (partcloo=vall)]
示例:
load data local inpath '/root/hive2_file/out_table.txt' overwrite into table out_table;
5.3 删除该表
1 | drop table out_table; |
6. 内部表与外部表的差异
- 创建外部表需要添加 external 字段。而内部表不需要。
- 删除外部表时,HDFS中的数据文件不会一起被删除。而删除内部表时,表数据及HDFS中的数据文件都会被删除。
7. 分区表
select查询中会扫描整个表内容,会消耗大量时间。由于相当多的时候人们只关心表中的一部分数据,
故建表时引入了分区概念。
hive分区表:是指在创建表时指定的partition的分区空间,若需要创建有分区的表,
需要在create表的时候调用可选参数partitioned by,详见表创建的语法结构。
7.1 创建分区表
1 | 可以创建单分区或者多分区,partitioned by(... , ...); |
7.2 导入数据
1 | 导入单分区表数据 |
7.3 增加分区(表已创建,在此基础上添加分区)
1 | 说明:仅在表的目录下面增加目录,当有location指令时,则表示路径下的文件与表联系起来了。 |
7.4 删除分区
1 | alter table 表名 drop partition (....); |
7.5 查看分区语句
1 | show partitions 表名; |
点关注,不迷路
好了各位,以上就是这篇文章的全部内容了,能看到这里的人呀,都是人才。
白嫖不好,创作不易。各位的支持和认可,就是我创作的最大动力,我们下篇文章见!
如果本篇博客有任何错误,请批评指教,不胜感激 !
原文作者: create17
原文链接: https://841809077.github.io/2018/03/19/Hive/hive2知识点总结.html
版权声明: 转载请注明出处(码字不易,请保留作者署名及链接,谢谢配合!)