版权声明:个人原创,转载请标注! https://blog.csdn.net/Z_Date/article/details/84068785
首先在了解hbase之前需要进行一个区分,主要hive和hbase的区别? hive是数据仓库的工具,hive不是真正保存数据的。而对hdfs上的数据进行了映射。而hbase 是一个数据库 数据是由hbase来进行保存的
hive的主要目的是为了分析数据, hbase的目的是保存海量的数据
Hbase的来源:
之前在讲解hadoop的时候 hadoop的诞生源自于谷歌的三大论文:
GFS HDFS
MapReduce MapReduce
Bigtable Hbase (hadoop base )
BigTable 背景:爬取网页,都是非结构化的数据 如何有效的存储? bigtable的设计思想为
多行三列的大表
Hbase 正是继承了这种思想,开发hbase数据库,是一个面向列,可扩展的,非关系型数据库(no sql 数据库)
非关系型的数据库:
Mongodb: c++编写 基于文档的方式存储,存储格式都是json格式
Redis:基于内存的,key-value的形式 出现的。通过key可以快速的找到value
关系型数据库:
MySQL
Oracle
Sqlserver
Hbases的解决的问题与诞生背景:
互联网的公司数据一般都是爬取过来的,大量的数据如何存储,并且都是非结构化,传统的数据库不能满足需求了
交通部门的探头,每天拍照的内容,都是图像,不能保存在关系型数据库中
总结: hbase适合存储海量数据,能够将查询速度范围控制在秒的级别,并且hbase是面向列存储的