1. 经典的WordCound程序(WordCount.java),可参见 hadoop0.18文档
2. 保证hadoop集群是配置好了的,单机的也好。新建一个目录,比如 /home/admin/WordCount
编译WordCount.java程序。
3. 编译完后在/home/admin/WordCount目录会发现三个class文件 WordCount.class,WordCount$Map.class,WordCount$Reduce.class。
cd 进入 /home/admin/WordCount目录,然后执行:
就会生成 WordCount.jar 文件。
4. 构造一些输入数据
input1.txt和input2.txt的文件里面是一些单词。如下:
在hadoop上新建目录,和put程序运行所需要的输入文件:
5. 运行程序,会显示job运行时的一些信息。
6. 查看运行结果