我们已经在前一章讨论了Flume的架构。在本章中,让我们看看如何下载和设置ApacheFlume。
在继续进行之前,您需要在系统中有一个Java环境。因此,首先,确保您在系统中安装了Java。对于本教程中的一些示例,我们使用HadoopHDFS(作为sink)。因此,我们建议您去安装Hadoop和Java。为了收集更多的信息,请按照链接-http://www.tutorialspoint.com/hadoop/hadoop_enviornment_setup.htm
安装Flume
首先,从网站上下载最新版本的Apache水槽软件https://flume.apache.org/。
步骤1
打开网站。点击上下载的主页左侧的链接。它会带你到ApacheFlume的下载页面。
第2步
在下载页面中,您可以看到ApacheFlume的二进制文件和源文件的链接。点击链接Apache的水槽-1.6.0-bin.tar.gz
您将被重定向到镜像列表,您可以通过单击这些镜像中的任何一个来启动下载。以同样的方式,你可以通过点击下载Apache水槽的源代码Apache的水槽-1.6.0-src.tar.gz。
步骤3
创建在安装目录相同的目录名称水槽目录的Hadoop,HBase的安装了,和其他软件(如果你已经安装了的话),如下图所示。
$mkdirFlume
步骤4
提取下载的tar文件,如下所示。
$cdDownloads/
$tarzxvfapache-flume-1.6.0-bin.tar.gz
$tarzxvfapache-flume-1.6.0-src.tar.gz
步骤5
移动apache-内容水槽-1.6.0-bin.tar文件到水槽,如下图所示前面创建的目录。(假设我们在名为Hadoop的本地用户中创建了Flume目录)。
$mvapache-flume-1.6.0-bin.tar/*/home/Hadoop/Flume/
配置Flume
要配置水槽,我们必须修改三个文件,即flume-env.sh,flumeconf.properties,和bash.rc。
设置路径/类路径
在的.bashrc文件,设置主文件夹,路径和水槽类路径,如下图所示。
conf文件夹
如果打开的conf阿帕奇水槽的文件夹,您将有以下四个文件-
flume-conf.properties.template,
flume-env.sh.template,
flume-env.ps1.template和
log4j.properties。
现在重命名
水槽-conf.properties.template文件flume-conf.properties和
水槽-env.sh.template作为flume-env.sh
flume-env.sh
打开flume-env.sh文件和设置JAVA_HOME到Java是安装在系统中的文件夹。
验证安装
通过浏览验证Apache的水槽的安装箱文件夹,然后键入以下命令。
$./flume-ng
如果您已成功安装Flume,您将收到Flume的帮助提示,如下所示。
|