设为首页 加入收藏

TOP

HBase对比HDFS
2018-11-29 00:10:15 】 浏览:70
Tags:HBase 对比 HDFS
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u013817676/article/details/82020668

什么是HDFS(Hadoop分布式文件系统):HDFS允许以分布式和冗余方式存储大量数据。

HDFS组件
NameNode
DataNode
NameNode:NameNode可以被视为系统的管理者。它维护系统文件树以及系统中存在的所有文件和目录的元数据。其中“命名空间镜像(Namespace image)”和“编辑日志”用于存储元数据信息。 Namenode包含所有数据节点的数据块信息,但是,它不会持久存储数据节点数据块位置信息。系统启动时,每次从数据节点重建此信息。
DataNode:是集群中的从属者,提供实际存储。它主要负责为客户提供读写请求服务。

HDFS架构:
这里写图片描述
什么是Hbase: Hbase是一个可以运行在Hadoop集群上的NoSQL数据库。
Hbase组件
Hbase Master
Region Server
Region
Zookeeper
Hbase的架构图如下图所示:
这里写图片描述

Hbase与HDFS对比
这里写图片描述
总结一下:什么时候选用Hbase,什么场景使用HDFS进行存储?
1. 对于经常需要修改原有的数据的场景使用Hbase进行存储;
2. 对于性能要求不高且只需要支持单条数据查询或者小批量数据进行查询,两者均可;
3. 对于需要经常进行全表扫描进行大批量的查询的选择HDFS;

听说Hbase在进行大量全表扫描查询的时候会出现GC问题,不知道在cache回收的时候如何解决大量的GC问题,求解答。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇HDFS基本命令的使用 下一篇HDFS 上传数据大致流程

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目