首家大数据培训挂牌机构 股票代码:837906 | EN CN

hive数据加载

于2017-04-01由小牛君创建

分享到:


hive作者:字母哥

数据装载入表

数据表

注意事项:

  • hive建表默认使用单个分隔符号:例如:如果定义分隔符号‘#$’,数据查询只有#被当作分隔符号使用。
  • load数据,字段类型不匹配时,查询返回NULL
  • select查询插入数据,字段类型不匹配时,查询返回NULL
  • hive在数据加载的时候不做类型检查,查询的时候做检查。

外部分区表:即使HDFS目录结构符合分区,数据加载后,仍然需要表结构添加分区才能查看数据。否则有数据也看不到。

通过外部表导入

用户在hive上建external表,建表的同时指定hdfs路径,在数据拷贝到指定hdfs路径的同时,也同时完成数据插入external表。表导入

从本地linux文件系统导入

文件导入

从hdfs导入

HDFS导入

从其它表导入数据:

表导入hive> CREATE EXTERNAL TABLE MYTEST4(num INT) ;

hive> FROM MYTEST3 test3

> INSERT OVERWRITE TABLE MYTEST4

> select test3.num where name=’world’;

via:字母哥博客

End.