练习五:安装并使用 HIVE¶
参考资料¶
- windows下大数据开发环境搭建(5)——Hive环境搭建
- Hive3.1.2安装指南 - 厦门大学林子雨老师
- 实验1 Hive 安装部署 - CSDN
- Ubuntu彻底卸载MySQL - CSDN
- 数据库初始化设置密码时报错"SET PASSWORD has no significance for user 'root'@'localhost' as the authentication met... - CSDN
- Ubuntu20.04上安装MySQL8.0(绝对保证能够正常使用)
一、实验目的¶
- 安装 HIVE
- 使用 HIVE 进行简单操作
二、实验环境¶
- 操作系统:
Ubuntu20.04.5
- 开发环境:
JDK1.8
,Hadoop3.1.3
,MySQL8.0.31
,HIVE3.1.2
三、实验内容和要求¶
1 下载并上传安装包¶
1.1 下载 HIVE 安装包¶
- 下载地址:https://dlcdn.apache.org/hive/hive-3.1.2/
1.2 下载 MySQL JDBC 包¶
- 官网下载地址:https://dev.mysql.com/downloads/connector/j/
1.3 上传安装包¶
2 安装并配置 HIVE¶
2.1 安装 HIVE¶
解压到当前用户的
usr/local
中
1 |
|
切换目录
1 |
|
修改文件名
1 |
|
2.2 配置环境变量¶
修改环境变量文件
1 |
|
添加 HIVE 安装路径
1 |
|
在 Path 中添加
1 |
|
在完成上述操作后的环境变量文件至少应包含以下信息:JAVA、Hadoop、HIVE(缺一不可)。
配置生效
1 |
|
2.3 修改 HIVE 配置¶
切换到 HIVE 配置目录
!!注:接下来的操作都是在此目录下进行的。
1 |
|
重命名文件
1 |
|
新建
hive-site.xml
1 |
|
- 输入以下内容后,保存并退出。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
|
配置
hive-env.sh
文件
1 |
|
- 编辑文件
1 |
|
- 输入以下内容后,保存并退出
1 2 3 4 5 6 |
|
- 修改内容,如图所示
3 安装并配置 MySQL¶
3.1 安装 MySQL8.0¶
更新软件源
1 |
|
修复损坏的软件包
1 |
|
安装 MySQL 最新版
1 |
|
以 root 账户运行 mysql
1 |
|
运行命令后,输入设置的密码即可启动 MySQL Shell。
3.2 配置 MySQL JDBC 包¶
接下来,我们要将 mysql-connector-j-8.0.31.jar
拷贝到 ~/usr/local/hive/lib
目录下。
解压包
1
tar -zxvf ~/Downloads/mysql-connector-j-8.0.31.tar.gz -C ~/Downloads/
切换目录
1 |
|
复制
jar
文件
1
cp mysql-connector-j-8.0.31.jar ~/usr/local/hive/lib
4 首次启动 HIVE¶
HIVE 是基于 Hadoop 的,所以需要先启动 Hadoop 才能启动 HIVE。
启动 Hadoop 的 HDFS
1 |
|
初始化当前 Hive 版本的 Metastore 架构
1 |
|
- 此操作将会在 mysql 中创建一个 hive 的数据库。
查看相关信息
1 |
|
启动 HIVE
1 |
|
退出 HIVE
1 |
|
5 HIVE 的增改查删 CURD 基本操作¶
经过前面的操作,我们已经配置了 HIVE 的运行环境,并成功启动了一次 HIVE,此时 hive 数据库已经被建立。接下来,我们将在 hive 数据库中进行增改查删一系列的数据库基本操作。
5.1 创建数据表¶
在 hive 数据库中,创建测绘遥感类 SCI 期刊信息表 journals_info
,含四个属性:
-
journal_Name
:期刊名称 -
partition
:分区级别 -
top
:是否顶刊 -
2021_IF
:2021年影响因子
创建表并配置存储路径
1 2 3 4 5 6 7 |
|
5.2 创建视图¶
创建视图 little_journals_info
,其中只包含 journals_info
表中 journal_name
,partition
属性。
1 |
|
5.3 查看数据库、表与视图¶
查看 HIVE 中所有的数据库
1 |
|
查看 hive 数据库中所有表
1 2 |
|
四、问题与解决方案¶
1 问题一¶
1.1 问题描述¶
MySQL 数据库在进行初始化时,设置密码报错:
1 2 |
|
1.2 解决方案¶
2 问题二¶
2.1 问题描述¶
在启动 Hadoop 时,出现以下错误,程序无法正常启动。
1 |
|
2.2 解决方案¶
查看当前 IP 地址
1 |
|
检查 hosts 文件配置
1 |
|
如果发现 IP 地址不一致,修改为当前地址保存并退出即可。
3 问题三¶
3.1 问题描述¶
在初始化 HIVE 时,遇到如下错误导致无法启动:
1 |
|
3.2 解决方案¶
- 查看
hadoop
安装目录下share/hadoop/common/lib
内guava.jar
版本 - 查看
hive
安装目录下lib
内guava.jar
的版本,如果两者不一致,删除版本低的,并拷贝高版本的即可解决问题 - 使用 Xftp 将两个目录下的
guava.jar
包改为同一个版本。
创建日期: 2022-12-27
作者: