设为首页 加入收藏

TOP

flume组件汇总 (source, channel, sink)
2018-11-13 16:14:50 】 浏览:87
Tags:flume 组件 汇总 source channel sink
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Tc_To_Top/article/details/52217701

Source

Source类型 说明
AvroSource 支持Avro协议(实际上是AvroRPC),内置支持
ThriftSource 支持Thrift协议,内置支持
ExecSource 基于Unix的command在标准输出上生产数据
JMSSource 从JMS系统(消息、主题)中读取数据,ActiveMQ已经测试过
SpoolingDirectorySource 监控指定目录内数据变更
Twitter1%firehoseSource 通过API持续下载Twitter数据,试验性质
NetcatSource 监控某个端口,将流经端口的每一个文本行数据作为Event输入
SequenceGeneratorSource 序列生成器数据源,生产序列数据

SyslogSources

syslogtcp

multiport_syslogtcp

syslogudp

读取syslog数据,产生Event,支持UDP和TCP两种协议
HTTPSource 基于HTTPPOST或GET方式的数据源,支持JSON、BLOB表示形式
LegacySources 兼容老的FlumeOG中Source(0.9.x版本)
AvroLegacySource
ThriftLegacySource
ScribeSource
CustomSource 自定义Source


Sink

Sink类型 说明
HDFSSink 数据写入HDFS
LoggerSink 数据写入日志文件
AvroSink 数据被转换成AvroEvent,然后发送到配置的RPC端口上
ThriftSink 数据被转换成ThriftEvent,然后发送到配置的RPC端口上
IRCSink 数据在IRC上进行回放
FileRollSink 存储数据到本地文件系统
NullSink 丢弃到所有数据
HBaseSink 数据写入HBase数据库
MorphlineSolrSink 数据发送到Solr搜索服务器(集群)
ElasticSearchSink 数据发送到ElasticSearch搜索服务器(集群)
KiteDatasetSink 写数据到KiteDataset,试验性质的
CustomSink 自定义Sink实现


Channel

Channel类型 说明
MemoryChannel Event数据存储在内存中
JDBCChannel Event数据存储在持久化存储中,当前FlumeChannel内置支持Derby
FileChannel Event数据存储在磁盘文件中
SpillableMemoryChannel Event数据存储在内存中和磁盘上,当内存队列满了,会持久化到磁盘文件(当前试验性的,不建议生产环境使用)
PseudoTransactionChannel 测试用途
CustomChannel 自定义Channel实现

EventDeserializers

在source组件上指定,反序列化,将输入(文件、流)解析成event的方式,

Deserializer类型 说明
LINE 默认值,将文本输入的每行转换成一个event
AVRO 读取avro文件,将其中的每条avro记录转换成一个event,每个event都附带着模式信息
BlobDeserializer 将整个二进制大数据转换成一个evnt,通常一个BLOB就是一个文件,比如PDF、JPG


EventSerializers

在sink组将上指定,序列化,将event对象转换成文件的方式。

Serializer类型 说明
TEXT(BodyTextSerializer) 默认值,将event中body里的数据不做改变的转换成输出流,event的header将被忽略
AVRO_EVENT(AvroEventSerializer) 将event转换成avro文件
BlobDeserializer 将整个二进制大数据转换成一个evnt,通常一个BLOB就是一个文件,比如PDF、JPG


Interceptor

拦截器可以修改或删除event。

拦截器可以组成拦截器链,中间用空格分隔,拦截器的配置顺序即是它们的执行顺序。

Handler类型 说明
TimestampInterceptor 向eventheader中添加了timestamp变量,值是时间戳
HostInterceptor 向eventheader中添加了host变量,可以通%{host}引用(比如在HDFSsink中的路径占位符)
StaticInterceptor 配置一个静态的值到eventheader里,多个静态值需要配多个staticinterceptor
UUIDInterceptor 向eventheader里添加变量id,值是随机生成的uuid,可以用这个唯一标识一个event
MorphlineInterceptor 使用morphline配置文件过滤event。
RegexFilteringInterceptor 使用正则表达式过滤(include或exclude)event。
RegexExtractorInterceptor 使用正则表达式来向header中添加key、value。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇第四次实验:树莓派下安装flume-1.. 下一篇Flume架构与源码分析-核心组件分..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目