Hive - Built-in Functions

Hive内置函数 - 从简介，安装，数据类型，创建数据库，删除数据库，创建表，更改表，删除表，分区，内置运算符，Hiveql select..Where，从简单而简单的步骤学习Hive教程，Hiveql选择Order By，Hiveql Group By，Hiveql Joins，内置函数，视图和索引。

本章介绍了Hive中可用的内置功能.这些函数看起来与SQL函数非常相似，除了它们的用法.

内置函数

Hive支持以下内置函数:

返回类型	签名	描述
BIGINT	round(double a)	它返回double的舍入BIGINT值.
BIGINT	floor(double a)	返回等于或小于double的最大BIGINT值.
BIGINT	ceil(double a)	返回等于或大于double的最小BIGINT值.
double	rand()，rand(int seed)	它返回一个随行变化的随机数.
string	concat(string A，str B，...)	它返回在A之后连接B得到的字符串.
string	substr(字符串A，int start)	它返回从开始位置到结束的A的子字符串字符串A.
字符串	substr(字符串A，int start，int长度)	它从给定长度的起始位置开始返回A的子串.
string	upper(字符串A)	它返回将A的所有字符转换为大写字符所产生的字符串.

string	ucase(string A)	与上述相同.
string	lower(字符串A)	它返回将B的所有字符转换为小写的字符串.
string	lcase(字符串A)	与上述相同.
string	trim(字符串A)	它返回从A两端修剪空格得到的字符串.
string	ltrim(字符串A)	它返回从A的开头(左侧)修剪空格所产生的字符串.
string	rtrim(string A)	rtrim(string A ) 它返回从A的结尾(右侧)修剪空格所产生的字符串.
string	regexp_replace(字符串A，字符串B，字符串C)	它返回替换B中与Java常规字符串匹配的所有子字符串的字符串表达式语法与C.
int	size(地图< K.V> ;)	它返回地图类型中元素的数量.
int	size(Array< T>)
< type>	cast(< expr> as< type>)	它将表达式expr的结果转换为< type>例如cast('1'作为BIGINT)将字符串'1'转换为整数表示.如果转换不成功，则返回NULL.
string	from_unixtime (int unixtime)	将Unix纪元(1970-01-01 00:00:00 UTC)的秒数转换为表示当前系统时间内该时刻的时间戳的字符串区域格式为"1970-01-01 00:00:00"
string	to_date(字符串时间戳)	它返回时间戳字符串的日期部分:to_date("1970-01-01 00:00:00")="1970- 01-01"
int	year(字符串日期)	它返回日期或时间戳字符串的年份部分:年("1970-01-01 00:00:00")= 1970，年("1970-01-01")= 1970
int	月(字符串日期)	它返回日期或时间戳字符串的月份部分:月份("1970-11-01 00:00:00")= 11，月份("1970-11-01")= 11
int	day(字符串日期)	它返回日期或时间戳字符串的日期部分:day("1970-11-01 00:00:00")= 1，day ("1970-11-01")= 1
string	get_json_object (字符串json_string，字符串路径)	它根据指定的json路径从json字符串中提取json对象，并返回提取的json对象的json字符串.如果输入的json字符串无效，则返回NULL.

示例

以下查询演示了一些内置函数:

round()函数

hive> SELECT round(2.6) from temp;

成功执行查询后，您会看到以下响应:

3.0

floor()函数

hive> SELECT floor(2.6) from temp;

成功执行查询后，您会看到以下回复:

2.0

ceil()函数

hive> SELECT ceil(2.6) from temp;

成功执行查询后，您会看到以下回复:

3.0

聚合函数

Hive支持以下内置聚合函数.这些函数的用法与SQL聚合函数相同.

返回类型	签名	描述
BIGINT	count(*)，count(expr)，	count(*) - 返回总数检索行.
DOUBLE	sum(col)，sum(DISTINCT col )	它返回组中元素的总和或组中列的不同值的总和.
DOUBLE	avg(col)，avg(DISTINCT col)	它返回平均值组中的元素或组中列的不同值的平均值.
DOUBLE	min(col)	它返回组中列的最小值.
DOUBLE	max(col)	它返回组中列的最大值.