Hive安装使用心得 - Hive - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 大数据 -> Hive

TOP

Hive安装使用心得

2019-05-06 01:05:22 【大中小】浏览:53次

Tags：Hive 安装使用心得

来源：http://www.cnblogs.com/liuyifeng/p/4721189.html

一、Hive的安装

1.1Hive的安装过程

下载hive源文件（apache-hive-0.14.0-bin.tar.gz）

解压hive文件

进入$HIVE_HOME/conf/修改文件

cp hive-env.sh.template hive-env.sh

cp hive-default.xml.template（模板文档，提供了hive很多参数）hive-site.xml

修改$HIVE_HOME/conf的hive-env.sh，增加以下三行

export JAVA_HOME=/usr/local/jdk1.7.0_45

export HIVE_HOME=/usr/local/hive-0.14.0

export HADOOP_HOME=/usr/local/hadoop-2.6.0

配置MySQL的metastore

修改$HIVE_HOME/conf/hive-site.xml

<property>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://192.168.1.101:3306/hive？

createDatabaseIfNotExist=true</value>

</property>

<property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>（lib目录下默认没有驱动，需要自己下载mysql-connector-java-5.1.10.jar，因为自带了derby-10.10.1.1.jar，能启动derby数据库）

</property>

<property>

<name>javax.jdo.option.ConnectionUserName</name>

<value>hive</value>

</property>

<property>

<name>javax.jdo.option.ConnectionPassword</name>

<value>hive</value>

</property>

<property>

　　<name>hive.querylog.location</name>

　　<value>/usr/local/hive-0.14.0/tmp</value>

</property>

<property>

　　<name>hive.exec.local.scratchdir</name>

　　<value>/usr/local/hive-0.14.0/tmp</value>

</property>

<property>

　　<name>hive.downloaded.resources.dir</name>

　　<value>/usr/local/hive-0.14.0/tmp</value>

</property>

连接本地Mysql解决办法（感谢为我提供帮助的国柱、其国、世昌师兄们和老师）

1.首先登陆到mysql

mysql -uroot -pmysql

2.创建远程登陆用户并授权

grant all PRIVILEGES on test_db.* to root@'192.168.1.101' identified by 'root';

3.执行了上面的语句后，再执行下面的语句，方可立即生效。

flush privileges;

如果不行

先use mysql;

然后UPDATE user SET `Host` = '%' WHERE `User` = 'root' LIMIT 1;

flush privileges;

我还是有一些疑问1：现在不能用root用户登录，只能用其他用户登录对吗？其他用户的权限少了些什么？2配置文件连接的是192.168.1.101，在qlyog127.0.0.1新建一个hive数据库才能用（hive新建的表的元数据都保存在那里，而不是192.168.1.101）

新创建一个用户，不要用root，估计root串了。

use mysql;

grant all privileges on *.* to <用户名>@'%' identified by '密码';

flush privilege;

SELECT `Host`,`User` FROM user;

alter database hive character set latin1;

成功连接mysql启动hive

因为$HIVE_HOME/lib目录下有derby的jar包所以使用derby作为默认的metastore。

Hive1.2版本中的jline-2.12.jar包与hadoop2.6.0（jline-0.9.94.jar版本）不兼容，解决办法，将这个jar包复制到hadoop的lib目录下。

1.2hive web界面模式

web界面安装：

下载apache-hive-0.14.0-src.tar.gz（版本需要对应）

制作war包放在HIVE_HOME/lib/: （apache-hive-0.14.0-src.tar\apache-hive-0.14.0-src\hwi将web解压出来，里面的jsp文件就是hwi的显示界面）hwi/web/*里面所有的文件打成war包（压缩文件，并重命名为hive-hwi-0.14.0.war）

复制tool.jar(jdk的lib包下面的tool.jar包)到HIVE_HOME/lib下

修改hive-site.xml(HIVE_HOME/conf)

<property>

　　<name>hive.hwi.listen.host</name>

　　<value>0.0.0.0</value>

</property>

<property>

　　<name>hive.hwi.listen.port</name>

　　<value>9999</value>

</property>

<property>

　　<name>hive.hwi.war.file</name>

　　<value>lib/hive-hwi-0.14.0.war</value>

</property>

hive web界面的(端口号9999)启动方式

#hive --service hwi &（&表示后台显示）

用于通过浏览器来访问hive

http://hadoop0:9999/hwi/

可以查看hive的系统信息，hadoop日志路径信息等

1.3set命令使用

hive控制台set命令:

set hive.cli.print.current.db=true;

set hive.cli.print.header=true;

set hive.metastore.warehouse.dir=/hive;

hive参数初始化配置set命令:

~/.hiverc（存放在每个用户的主目录下面,可以创建一个.hiverc，将set命令的参数复制进去，重新启动执行hive，就可以将set命令执行起来）

补充：

hive历史操作命令集（more .hivehistory查看一下）

~/.hivehistory

直接查看（执行set），查看hadoop定义的全部变量，hive底层依赖的hadoop环境变量配置信息（set -v）

设置name变量并初始化（set hivevar：name=crxy;）显示（set hivevar：name;），传值（create table t2（name string,${hivevar:name} string）;）

基本数据类型

String和int在创建表，时间戳（hive与Hbase结合时，底层的映射结构，是自动完成，如果没有，hive与Hbase结合有困难）

2.1复合数据类型

创建学生表

hive>CREATE TABLE student(

id INT,

name STRING,

favors ARRAY<STRING>,

scores MAP<STRING, FLOAT>

);

2.2hive记录中默认分隔符

分隔符描述语句

\n分隔行LINES TERMINATED BY '\t'

^A分隔字段(列)，显示编码使用\001FIELDS TERMINATED BY '\001'

^B分隔复合类型中的元素，显示编码使用\002COLLECTION ITEMS TERMINATED BY '\002'

^C分隔map元素的key和value，显示编码使用\003MAP KEYS TERMINATED BY '\003'

Hdfs存储表时用的是分隔符

原始数据组织方式(导入hive表前的数据)

1001\001zhangsan\001AA\002\BB\001key\003value 1002\001lisi

在hdfs数组存放方式

1001^Azhangsan^AAA^BBB^Akey^Cvalue\n1002^Alisi

2.3复合类型—Struct使用

structs内部的数据可以通过DOT（.）来存取，例如，表中一列c的类型为STRUCT{a INT; b INT}，我们可以通过c.a来访问域a

hive> create table student_test(id INT,infostruct<name:STRING, age:INT>) ROW FORMAT DELIMITED(限定)FIELDS TERMINATED（终止）BY ',' COLLECTION（集合）ITEMS TERMINATED BY ':'; （第一个是字段id与struct结构体的分隔符逗号或者tab（\t）都可以，第二个是struct分割）

vi student_test

1001,zhangsan:24

1002,lisi:28

1003,wangwu:25

（local inpath,应该就是为什么可以将/root/student_test传进去)

(导入数据)load datalocal inpath"student_test"into table student_test;

Select * from student_test;

(查询id)select id from student_test;

(查询structs内部数据，通过点的方式)

select id,info.name from student_test;

Select id,info.name,info.age from student_test;

可以直接在MySQL(储存的是元数据)查看创建的表

也可以在hdfs（储存的是表的实际信息）上查看

dfs -cat /usr/hive/warehouse/student_test/student_test;

第一个是表名没有内容，第二个才是表的内容，除了默认格式不一样，指定格式显示就会一样的。

2.4复合类型—Array使用

array中的数据为相同类型，例如，假如array A中元素['a','b','c']，则A[1]的值为'b'

create table class_test(name string,student_id_listarray<INT>) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' COLLECTION ITEMS TERMINATED BY ':';

vi class_test

zhangsan,10:25:27:37

lisim,09:31:42:46

wangwu,06:12:18

(导入表)load data local inpath "class_test"into table class_test;

select * from class_test;

(查询名字)select name from class_test;

(集合类型的角标查询)select name,student_id_list[0] from class_test;

select name,lstudent_id_list[0] from class_testwhere name='zhangsan';

角标超出范围会显示NULL

按照列解析的

2.5复合类型—Map使用

访问指定域可以通过["指定域名称"]进行，例如，一个Map M包含了一个group-》gid的kv对，gid的值可以通过M['group']来获取

create table employee(id string,perfmap<string, int>) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY ',' MAP KEYS TERMINATED BY ':';

（字段之间使用的是\t(Tab键),集合（多个map就会是集合）之间的用，号，map之间用：分割）

vi employee（在~目录下面）

1001job:80,team:60,person:70

1002job:60,team:80,person:80

1003job:90,team:70,person:100

Load data local inpath"employee"into table employee;（备注;使用双引号和单引号也是可以的。）

(查询)Select *from employee;

Select id,perf['job'] from employee;

Select id,perf['job'],perf['person'] from employee;

(设置别名，显示表头)select id,perf['job']as job,perf['team'] as team,perf['person'] as person from employee;

三、数据定义

3.1数据库定义

默认数据库"default"

使用#hive命令后，不使用hive>use <数据库名>，系统默认的数据库。可以显式使用hive> use default;

创建一个新库

hive>CREATE DATABASE

[IF NOT EXISTS]mydb

[LOCATION]'/.......'

[COMMENT]'....';

hive>SHOW DATABASES;

hive>DESCRIBE DATABASE[extended]mydb;

hive>DROP DATABASE[IF EXISTS] mydb[CASCADE];

Create database mydb；

在hdfs创建mydb.db目录会存放mydb数据里面的内容

消除不必要的提示（干扰我们的判断）

Create database if not exists mydb；

Use mydb；

Create table t1(name string);

Show tables;

Create database bd;

Show databases;

Drop database if exists db;

(级联删除）

drop database if exists mydb cascade;

3.2 表定义

hive>CREATE TABLE IF NOT EXISTS t1(...)

[COMMENT '....']

[LOCATION '...']

(当前数据库显示其他数据库的表)hive>SHOW TABLES in mydb;

hive>CREATE TABLE t2 LIKE t1;

hive>DESCRIBE t2;

(寻找某个关键字的表)show tables in default 'class*';

(显示表的结构)desc t1;

（显示表的结构，原来的）describe t1;

(显示拓展信息)desc extended t1;

(显示拓展信息更加有结构，查看分隔符)desc formatted t1;

（创建另一个表进行测试，防止操作不当对原表造成伤害）create table t2 like t1;

(复制其他数据库的表的结构)Create table t3 like default.employee;

本文转自 SimplePoint 51CTO博客，原文链接：http://blog.51cto.com/2226894115/1898263，如需转载请自行联系原作者


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇： ..	下一篇：Exception in thread "main&..

最新文章

MetaException(message:For direct ..

Exception in thread "main&qu..

HIVE metastore Duplicate key name..

执行Hive语句报错：FAILED: Error i..

MetaException(message:Hive Schema..

热门文章

Hive取随机数 rand（）函数

hive中数据类型的转化CAST

Hive添加删除修改字段

Hive 实现 IN 和 NOT IN 子句

Hive中where 语句的“不等于”的陷阱

Hot 文章

Hive取随机数 rand（）函数

hive中数据类型的转化CAST

Hive添加删除修改字段

Hive 实现 IN 和 NOT IN 子句

Hive中where 语句的“不等于”的陷阱

Python

822

Django框架系列目录

656

创建Anaconda虚拟Pyt

1255

Python获取主目录的

893

Python中跨越多个文

544

chatgpt使用python写

745

一条爬虫抓取一个小

617

Python教程：sys.std

674

Python教程(13)——P

860

Docker安装配置Jupyt

742

【matplotlib基础】-

C 语言

544

C语言入坑总结

631

C数据结构-线性表之顺序表

1394

Programming abstractions in..

560

C语言内存布局

842

最全的李慧芹APUE-标准IO笔记

751

alog一个日志库

606

1.1.初识STM32及新建工程

809

codeblock安装及汉化教程

625

东方博宜OJ1000 熟悉一下Onli..

1353

关于指针与引用传递的效率问题

C++基础

1225

KMP 字符串匹配学习笔记

904

2.10 PE结构：重建重定位表结..

579

【Qt6】列表模型——抽象基类

703

2.12 PE结构：实现PE字节注入

631

569

2.14 PE结构：地址之间的转换

622

4.1 应用层Hook挂钩原理分析

980

使用Vulkan-Loader将ncnn代码..

644

4.3 IAT Hook 挂钩技术

551

C++ 学习笔记、01 | 开发简单..

大数据基础

1022

多线程：线程的同步

580

vertica-->kafka-

904

660

解决android studio

596

Kafka史上最详细原理

624

Error while fetchin

765

【Kafka】安装与快速

496

660

flume读取日志数据写

650

Authentication plug

linux编程基础

722

如何在Python中过滤字符串列表

729

如何在Python中读写文件

750

初识Lambda表达式

809

深入理解Python中的列表推导..

1029

如何在Python中执行外部命令

1089

设计模式之单例模式理解

603

跟我学Python GUI编程系列 - ..

1368

21道并发编程面试题

616

深入理解 Hadoop 序列化

986

CAS无锁机制深入理解

C/C++面试题目

1225

KMP 字符串匹配学习

579

【Qt6】列表模型——

904

2.10 PE结构：重建重

631

703

2.12 PE结构：实现PE

569

2.14 PE结构：地址之

980

使用Vulkan-Loader将

622

4.1 应用层Hook挂钩

644

4.3 IAT Hook 挂钩技

551

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3