Hive SQL标准介绍:
Hive定义了简单的类SQL查询语句,称HiveQL,与大部分SQL语法兼容,方便熟悉SQL的开发者使用Hive开发和处理复杂的分析工作,还可以用HQL进行查询。
1.数据类型
Hive支持基本类型和复杂类型,基本类型包括如下几种。
(1)整数类型:tinyint/smallint/int/bigint。
(2)浮点数类型:float/double/dicemal。
(3)布尔类型:boolean。
(4)字符串类型:string/varchar/char。
复杂类型包括如下几种。
(1)Array:数组类型,由一系列相同数据类型的元素组成。
(2)Map:集合类型,包括Key-Value键值对,可以通过Key来访问元素。
(3)Struct:结构类型,可以包含不同数据类型的元素,这些元素可以通过“点语法”的方式来得到所需要的元素。
2.DDL语句
DDL操作(Data Definition Language,数据定义语言),常用DDL语句。
(1) create/drop/alter数据库
(2) create/drop/truncate表
(3) alter表/分区/列
(4) Create/Drop/Alter视图
(5) Hive函数
Hive中内置了许多函数,比如日期操作函数day()、year()和month()等,数值操作函数sum()、avg()、max()、min()和count()等。但在某些特殊场景下,可能还是需要自定义函数满足特定功能,这时要用用户自定义函数UDF。
3.DML语句
DML(Data Manipulation Language,数据操作语言),常见的操作包括下面几个方面。
(1)将文件中的数据导入(load)到Hive表中
(2) select和filters
(3)数据表连接join操作
(4)将select查询结果导出到Hive的另一个表中
(5)将select查询结果写入文件
写入本地文件系统
写入分布式文件系统HDFS