设为首页 加入收藏

TOP

Hadoop学习——(3) 基本使用
2019-04-03 00:01:36 】 浏览:74
Tags:Hadoop 学习 基本 使用

1. HDFS基本使用

1.1 HDFS的存储目录

HDFS的文件存放在三类节点中,分别为NameNodeDataNodeSecondary NmaeNode,在hdfs-site.xml中配置的目录分别为/data/hadoop/hdfs/下的nndnsnn

查看nn里的文件如下,可以看到nn中存储有——

  • fsimage,记录某一永久性检查点(Checkpoint)时整个HDFS的元信息
  • edits,记录所有对HDFS的写信息
  • seed_txid,最近一次fsimage或inprogress的transaction ID,通过与最新的transaction ID比较保持数据一致性
  • in_use.lock,确保只有一个NameNode

查看snn里的文件如下,可以看到snn中存储有——

  • fsimageeditsin_use.lock,内容与nn相同
  • snn定期合并fsimage和edits文件,得到新的fsimage,使得重启时nn可以从该fsimage开始恢复,减少启动时间

查看dn里的文件如下,可以看到dn中存储有——

  • BP-1172818762-127.0.0.1-1554017610067,blockpool的ip地址和创建时间戳
  • current,里面包含实际的HDFS BLOCK数据,包括许多block_xx文件以及相应的.meta文件,.meta文件包含了checksum信息

1.2 HDFS基本命令

HDFS有很多与linux类似的命令,基本使用形式是hdfs dfs -[操作名] -[参数] \[目录],或者``hadoop fs -[操作名] -[参数] [目录]`。

  1. hdfs dfs -ls /,查看HDFS中/目录下的文件
  1. hdfs dfs -rm /user/a,删除/user目录下的a文件

  2. hdfs dfs -cat /user/b,查看/user目录下的b文件

  3. hdfs dfs -mkdir /user/c/,创建/user/c目录

  4. hdfs dfs -touchz /user/d,创建/user/d文件

  5. 其他命令可通过hdfs dfs -help查看

1.3 读取、写入文件

  1. hdfs dfs -get /user/a .,从/user读取a文件到当前目录
  1. hdfs dfs -put c /user,将本地的c文件写入到hdfs的/user目录中

这两个命令有对应的两个相同命令,如下:(在以前的版本好像是有区别的,不过版本2.6.5已经说了Identical)

Reference

  1. Hadoop HDFS本地存储目录结构解析

  2. Hadoop视频教程汇总

  3. Hadoop大数据平台架构与实践–基础篇_慕课网

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇sqoop   把 hdfs 和关系型数.. 下一篇java   正则匹配 HDFS路径..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目