版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_36057860/article/details/79844058
hadoop的四大组件:点击打开链接
hadoop是一个可靠的,可扩展的,开源的,可进行分布式计算的一个开源平台
-haddop_common -支持其他的hadoop通用程序
-hadoop hdfs -能进行高吞吐量访问分布式文件系统。
-hadoop yarn - 集群资源管理系统
-hadoop mapreduce -基于yarn进行大数据并行处理系统
hadoop_安装的三种模式:
单机模式:
介绍:不对配置文件进行修改,使用本地文件系统,而不是分布式文件系统。
不可以进行分布式计算。用来做一个简单的测试。测试hadoop是否安装成功
这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统
hadoop_配置_单机模式
伪分布式模式:
介绍:主从节点在一台机器上,没有进行真正的分布式结算,所有的节点都在一台机器上。
hadoop_配置_伪分布式
集群分布式模式:
介绍:3台以上机器或者虚拟机的集群,可以进行分布式计算
hadoop_配置_集群