Hadoop实例WordCount程序一步一步运行

2014-11-24 11:57:28 · 作者: · 浏览: 2

  1. 经典的WordCound程序(WordCount.java),可参见 hadoop0.18文档


  2. 保证hadoop集群是配置好了的,单机的也好。新建一个目录,比如 /home/admin/WordCount
  编译WordCount.java程序。


  3. 编译完后在/home/admin/WordCount目录会发现三个class文件 WordCount.class,WordCount$Map.class,WordCount$Reduce.class。
  cd 进入 /home/admin/WordCount目录,然后执行:


  就会生成 WordCount.jar 文件。


  4. 构造一些输入数据
  input1.txt和input2.txt的文件里面是一些单词。如下:


  在hadoop上新建目录,和put程序运行所需要的输入文件:


  5. 运行程序,会显示job运行时的一些信息。


  6. 查看运行结果