设为首页 加入收藏

TOP

第3章 认识HDFS习题
2018-12-13 16:16:15 】 浏览:203
Tags:认识 HDFS 习题

1.选择题

(1)在默认情况下,HDFS块的大小为(128MB)

(2)在大多数情况下,副本系数是3,HDFS的存放策略将第二个副本放在(不同机架的节点上)

(3)假设设置的副本数(即参宿dfs.replication)是3,现在系统中有5个副本,那么系统会删除(2)个副本。

(4)在配置文件hdfs-default.xml中定义副本率为(1)时,HDFS将永远处于安全模式。

(5)下列(B)不属于NameNode的功能。A.提供名称查询服务B.保存Block信息,汇报Block信息C.保存metadata信息D.metadata信息在启动后会加载到内存

2.问答题

(1)HDFS和传统的分布式文件系统相比较,有哪些独特的特性?

高容错性、可扩展性、可配置性强

文件权限和授权

机架感知功能

安全模式

负载均衡Load Balance(LB)

(2)为什么HDFS的块如此之大?

HDFS的块比磁盘块要大,目的是减小寻址开销。通过这个足够大的块,从磁盘一次读取数据的时间将远远大于定位于这个块开始端所消耗的时间。因此,传送一个由多块组成的文件的时间取决于磁盘传输速度。如果块太小,那么大量的时间将花在磁盘块的定位上。

(3)HDFS中数据副本的存放策略是什么?

HDFS默认副本系数是3,第一块放在本机的HDFS目录下;第二块放在不同Rack的某个DataNode上;第三块放在本机同机架的某台机器上。

(4)负载均衡作为一个独立的进程与NameNode分开执行,HDFS负载均衡的处理步骤是什么?

NN会搜集到所有DN的磁盘信息;
启动进程Rebalancing Server;
移动数据到目标机器上,同时删除自己机器上的数据。

(5)NameNode和DataNode的功能分别是什么?

NN的主要功能:
NN提供名称查询功能,它是一个Jetty服务器;
NN保存metadata信息。包括:文件owership和permissions;文件包含哪些块;
Block保存在哪个DN(由DN启动时上报);NN的metadata信息在启动后加载到内存。
DN的主要功能:
保存Block,每个块对应一个元数据的数据信息文件。这个文件主要描述这个块属于哪个文件、第几个块等信息。
启动DN线程时会向NN汇报Block信息。
通过向NN发送心跳保持与其联系(3秒一次),如果NN10分钟没有收到DN的心跳,则认为其已经lost,并将其上的Block复制到其他DataNode上。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Linux中HDFS简单的shell操作 下一篇sqoop   把 hdfs 和关系型数..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目