设为首页 加入收藏

TOP

hadoop部署(单节点)
2019-04-23 12:43:34 】 浏览:51
Tags:hadoop 部署 节点

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。
HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
实验环境:
操作系统:redhat6.5 iptables selinux off
hadoop-2.7.3版本,jdk 8版本

Hadoop安装及java环境搭建
解压tar包

[root@server4 ~]# tar xf hadoop-2.7.3.tar.gz -C /usr/local/
[root@server4 ~]# tar xf jdk-8u171-linux-x64.tar.gz -C /usr/local/

声明java

[root@server4 ~]# vim /usr/local/hadoop-2.7.3/etc/hadoop/hadoop-env.sh 
 export JAVA_HOME=/usr/local/jdk1.8.0_171  

独立操作debug

[root@server4 hadoop-2.7.3]# mkdir input
[root@server4 hadoop-2.7.3]# cp etc/hadoop/*.xml input
[root@server4 hadoop-2.7.3]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'
[root@server4 hadoop-2.7.3]# cat output/*
1   dfsadmin

伪分布集群搭建
配置core-site.xml

[root@server4 hadoop-2.7.3]# vim etc/hadoop/core-site.xml 
<configuration>
     <property>
         <name>fs.defaultFS</name>
         <value>hdfs://172.25.70.4:9000</value>                               
     </property>
</configuration>  

这里写图片描述
配置hdfs-site.xml

[root@server4 hadoop-2.7.3]# vim etc/hadoop/hdfs-site.xml
<configuration>
      <property>
         <name>dfs.replication</name>
         <value>1</value>
      </property>
</configuration>

这里写图片描述
免密登陆,设置免密

[root@server4 hadoop-2.7.3]# ssh-keygen 

这里写图片描述

[root@server4 hadoop-2.7.3]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[root@server4 hadoop-2.7.3]#  chmod 600 ~/.ssh/authorized_keys

测试

[root@server4 hadoop-2.7.3]# ssh root@172.25.70.4
##发现输入yes后可以直接进行ssh连接则成功

这里写图片描述
启动hdf
第一次要进行格式化

[root@server4 hadoop-2.7.3]# bin/hdfs namenode -format

通过脚本启动

[root@server4 hadoop-2.7.3]# sbin/start-dfs.sh

这里写图片描述
查看端口

[root@server4 hadoop-2.7.3]# netstat -antlp

这里写图片描述
在浏览器测试:

http://172.25.70.4:50070

这里写图片描述
配置java环境
加入环境变量

[root@server4 hadoop-2.7.3]# vim /root/.bash_profile 
PATH=$PATH:$HOME/bin:/usr/local/jdk1.8.0_171/bin 
[root@server4 hadoop-2.7.3]# source /root/.bash_profile
###刷新一下

这里写图片描述
通过java命令查看:
如果jps查看不存在,只要进程或者端口开启说明服务也启动成功了

[root@server4 hadoop-2.7.3]# jps

这里写图片描述
测试:创建目录

[root@server4 hadoop-2.7.3]# bin/hdfs dfs -mkdir /user
[root@server4 hadoop-2.7.3]# bin/hdfs dfs -mkdir /user/dream

在浏览器查看,点击utilities,在点击browse file system:
这里写图片描述
YARN单节点
配置mapred-site.xml

[root@server4 hadoop-2.7.3]# vim etc/hadoop/mapred-site.xml
<configuration>
     <property>
         <name>mapreduce.framework.name</name>
         <value>yarn</value>
     </property>
 </configuration>

这里写图片描述
配置yarn-site.xml

[root@server4 hadoop-2.7.3]# vim etc/hadoop/yarn-site.xml
<configuration>
     <property>
         <name>yarn.nodemanager.aux-services</name>
         <value>mapreduce_shuffle</value>
     </property>
 </configuration> 

这里写图片描述
启动yarn

[root@server4 hadoop-2.7.3]# sbin/start-yarn.sh
###停止的话把start换成stop即可

这里写图片描述
测试:在浏览器访问:

http://172.25.70.4:8088

这里写图片描述

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇hadoop 支持hbase 各个版本情况 下一篇【HDFS篇】搭建hadoop伪分布式集群

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目