您的位置:

Hive2详细解析

一、hive2.3.4配置

1、安装环境

CentOS 7.4.1708  
JDK 1.8.0_191  
Hadoop-2.7.7  
Hive-2.3.4  
MySQL-5.7.25  

2、配置hive-site.xml文件

<?xml version="1.0" encoding="UTF-8"?>  
<configuration>  
    <property>  
        <name>hive.metastore.local</name>  
        <value>false</value>  
        <description>Connect hive metastore server or not, if 'false' means using remote metastore server. If you modify this parameter to 'true', then you need to do some configuration like set hive.metastore.uris property which is pointed to a remote metastore server.</description>  
    </property>  
    
    <property>  
        <name>javax.jdo.option.ConnectionURL</name>  
        <value>jdbc:mysql://localhost:3306/hive?useSSL=false</value>  
        <description>The URL of MySQL database.</description>  
    </property>  
    
    <property>  
        <name>javax.jdo.option.ConnectionDriverName</name>  
        <value>com.mysql.jdbc.Driver</value>  
        <description>The class name of JDBC driver.</description>  
    </property>  
    
    <property>  
        <name>javax.jdo.option.ConnectionUserName</name>  
        <value>hive</value>  
        <description>Your MySQL username.</description>  
    </property>  
    
    <property>  
        <name>javax.jdo.option.ConnectionPassword</name>  
        <value>hive</value>  
        <description>Your MySQL password.</description>  
    </property>  
    
</configuration>  

二、hive2.1.1

Apache Hive是Facebook开源的一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。

三、hive2.0是哪一年

Apache Hive 2.0于2016年3月发布,是一个重要的里程碑,主要改进有:

1、Spark引擎支持

2、支持多表查询

3、增加了一个新的类型—interval类型

四、hive2和hive3区别

1、Hive3使用了Python3代替Python2

2、Hive3更新了一些SQL标准功能

3、Hive3使用了Apache Calcite作为其SQL解析器

五、hive2中的decode用法

decode是hiveql的内置函数,用于根据指定的2进制字符串和给出的编码表(或默认编码表)将二进制字符串解码为ASCII字符串。

其中,参数1为被解码的二进制字符串,第二个参数是一个字符串列表,每一项包含两个ascii码值,他们代表一个字节的编码,当程序需要解码时,会将第一个字符映射成二进制0,将第二个字符映射成二进制1

select decode("0100000101000010", "utf-8") //输出"AB"

六、hive2.3.9使用spark引擎

启用spark引擎在hive-site.xml中添加如下配置即可

<property>  
    <name>hive.execution.engine</name>  
    <value>spark</value>  
    <description>Execution engine used by Hive</description>  
</property>  

七、hive的命令操作

1、创建表

CREATE TABLE tableName(  
    column1 data_type constraint1,  
    column2 data_type constraint2,  
    column3 data_type constraint3,  
)     

2、删除表

DROP TABLE table_name

3、查询表

SELECT * FROM table_name

八、hive怎么用

1、进入hive

cd $hive_home/bin    
hive

2、进入hive命令

cd $hive_home/bin  
hive -f /opt/XXX.sql