Hadoop之HDFS分布式文件系统读写流程详解 - Hdfs - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 大数据 -> Hdfs

TOP

Hadoop之HDFS分布式文件系统读写流程详解

2019-04-18 00:15:51 【大中小】浏览:65次

Tags：Hadoop HDFS 分布式文件系统读写流程详解

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/mmd0308/article/details/75003494

1、名词解释：

NameNode：

①、整个文件系统的管理节点。维护着整个文件系统的文件目录，文件/目录的元信息和每个文件对应的数据块列表。接收用户的操作请求。

②、文件包括:

fsimage:元数据镜像文件。存储某一段NameNode内存元数据信息。

edits：擦偶走日志文件。

fstime：保存最近一次的checkpoint的时间。

DataNode：

①、DataNode根据客户端的请求对文件系统执行读写操作。

②、它们还根据NameNode的指令执行诸如块的创建，删除和复制的操作。

Block：

一般用户数据存储在HDFS的文件中。文件系统中的文件将会分成一个或多个段和/或存储在各个数据节点中。这些文件段被称为块。换句话说，HDFS可以读取或写入的最小数据量称为块。默认块是128MB，dfs.block.size可以根据需要进行更改。

2、数据写入流程：

图析：

客户端向NameNode发送文件上传申请。
NameNode返回Block存储DataNode地址等信息。
客户端写入文件到DataNode中。
当客户端写入一份数据之后，DataNode之间会异步的进行Block复制。
当最后面的DataNode上写完Block后，都会发送一个最终确认信息给前一个DataNode。
DataNode反馈给客户端，数据写入完毕。
客户端向NameNode发送最终的Block确认信息。

3、数据读取流程：

图析：

客户端发送读取数据的请求给NameNode。
NameNode反馈数据的DataNode存储地址及副本存储地址。
客户端直接在DataNode上读取数据。

4、总结：

简单的根据自己的理解画了一些HDFS的读写流程，如有不对，望大神指出。
了解原理，使我们更加深刻的理解HDFS设计。
入门新手，请大神多多指点指点。


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：HDFS（二）	下一篇：大数据系列之Hadoop知识整理（四..

最新文章

centos-7 部署hadoop2.5.1 >>..

centos-7 部署hadoop2.5.1 >>..

Hadoop的转载

ganglia安装和配置

java查漏补缺（三）

热门文章

大数据笔试题大全

flink使用BucketingSink将文件写入h..

使用python中的pyhdfs连接HDFS进行..

HDFS高可用（HA）之ZKFC详解

HDFS查看文件的前几行-后几行-行数

Hot 文章

大数据笔试题大全

flink使用BucketingSink将文件写入h..

使用python中的pyhdfs连接HDFS进行..

HDFS高可用（HA）之ZKFC详解

HDFS查看文件的前几行-后几行-行数

Python

819

Django框架系列目录

655

创建Anaconda虚拟Pyt

1255

Python获取主目录的

893

Python中跨越多个文

543

chatgpt使用python写

745

一条爬虫抓取一个小

614

Python教程：sys.std

673

Python教程(13)——P

860

Docker安装配置Jupyt

741

【matplotlib基础】-

C 语言

543

C语言入坑总结

631

C数据结构-线性表之顺序表

1394

Programming abstractions in..

555

C语言内存布局

841

最全的李慧芹APUE-标准IO笔记

751

alog一个日志库

606

1.1.初识STM32及新建工程

809

codeblock安装及汉化教程

624

东方博宜OJ1000 熟悉一下Onli..

1352

关于指针与引用传递的效率问题

C++基础

1224

KMP 字符串匹配学习笔记

903

2.10 PE结构：重建重定位表结..

578

【Qt6】列表模型——抽象基类

702

2.12 PE结构：实现PE字节注入

630

569

2.14 PE结构：地址之间的转换

621

4.1 应用层Hook挂钩原理分析

980

使用Vulkan-Loader将ncnn代码..

644

4.3 IAT Hook 挂钩技术

551

C++ 学习笔记、01 | 开发简单..

大数据基础

1021

多线程：线程的同步

580

vertica-->kafka-

903

658

解决android studio

595

Kafka史上最详细原理

621

Error while fetchin

762

【Kafka】安装与快速

496

659

flume读取日志数据写

650

Authentication plug

linux编程基础

720

如何在Python中过滤字符串列表

728

如何在Python中读写文件

748

初识Lambda表达式

806

深入理解Python中的列表推导..

1029

如何在Python中执行外部命令

1088

设计模式之单例模式理解

601

跟我学Python GUI编程系列 - ..

1366

21道并发编程面试题

615

深入理解 Hadoop 序列化

985

CAS无锁机制深入理解

C/C++面试题目

1224

KMP 字符串匹配学习

578

【Qt6】列表模型——

903

2.10 PE结构：重建重

630

702

2.12 PE结构：实现PE

569

2.14 PE结构：地址之

980

使用Vulkan-Loader将

621

4.1 应用层Hook挂钩

644

4.3 IAT Hook 挂钩技

551

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3