Flume 初探 - 数据库编程 - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 基础 -> 数据库编程

TOP

Flume 初探

2019-09-24 18:11:19 【大中小】浏览:50次

Tags：Flume 初探

Apache 是一个高可用、高可靠的，分布式的海量日志采集、聚合、传输系统，基于流式架构，灵活简单。 Flume 最主要的作用就是实时读取服务器本地磁盘的数据，将数据写入HDFS中。 Flume组成架构详解： Source输入端常用的类型有：spooling directory、exec、avro、syslog、netcat 等 Put事务的流程： doPut：将批数据先写入临时缓冲区putList doCommit：检查channel内存队列是否足够合并 doRollback；channel内存队列空间不足，回滚数据 Channel是位于Source和Sink之间的缓冲区，Flume自带两种channel：MemoryChannel和FileChannel MemoryChannel是基于内存的缓存，在不需要关心数据丢失的情景下使用。 FileChannel是Flume的持久化Channel，系统宕机不会丢失数据。 Take事务： doTake：先将数据取到临时缓冲区takeList doCommit：如果数据发送成功，则清除临时缓冲区的takeList doRollback:数据发送过程中如果出现异常，rollback将临时缓冲区takeList中的数据归还给channel内存队列 Sink组件常见的目的地包括： HDFS、Kafka、avro、logger、File、自定义。 Sink不断地轮询Channel中的事件且批量地移除它们，并将这些事件批量写入到存储或索引系统、或者被发送到另一个Flume Agent。 Sink是完全事务性的。在从Channel批量删除数据之前，每个Sink用Channel启动一个事务。批量事件一旦成功写出到存储系统或下一个Flume Agent，Sink就利用Channel提交事务。事务一旦被提交，该Channel从自己的内部缓冲区删除事件。 Sink组件目的地包括hdfs、logger、avro、thrift、ipc、file、null、HBase、solr、自定义。 Agent是一个JVM进程，是flume数据传输的基本单元 Agent主要有3个部分组成，Source、Channel、Sink。


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：数据库-如何创建SQL Server身份验..	下一篇：NodeManager概述(基本职能和内部..

最新文章

如何在Ubuntu 18.04上安装和配置Red..

Redis 配置文件redis.conf 示例详解

redis集群设计方案及原理

SpringBoot集成Redis的三种方式

Redis的几种应用实战

热门文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Hot 文章

MySQL & Perl, 便利之合

Oracle之sqlplus / as sysdba;

CentOS 7下rpm安装MySQL 5.6.36

mysql启动出现1067错误Can't fi..

考试系统维护--不同版本SQL数据导入..

Python

811

Django框架系列目录

649

创建Anaconda虚拟Pyt

1247

Python获取主目录的

883

Python中跨越多个文

537

chatgpt使用python写

735

一条爬虫抓取一个小

605

Python教程：sys.std

667

Python教程(13)——P

850

Docker安装配置Jupyt

730

【matplotlib基础】-

C 语言

530

C语言入坑总结

621

C数据结构-线性表之顺序表

1385

Programming abstractions in..

547

C语言内存布局

831

最全的李慧芹APUE-标准IO笔记

744

alog一个日志库

599

1.1.初识STM32及新建工程

799

codeblock安装及汉化教程

616

东方博宜OJ1000 熟悉一下Onli..

1344

关于指针与引用传递的效率问题

C++基础

1216

KMP 字符串匹配学习笔记

895

2.10 PE结构：重建重定位表结..

570

【Qt6】列表模型——抽象基类

695

2.12 PE结构：实现PE字节注入

621

560

2.14 PE结构：地址之间的转换

612

4.1 应用层Hook挂钩原理分析

972

使用Vulkan-Loader将ncnn代码..

634

4.3 IAT Hook 挂钩技术

545

C++ 学习笔记、01 | 开发简单..

大数据基础

1009

多线程：线程的同步

572

vertica-->kafka-

895

650

解决android studio

585

Kafka史上最详细原理

614

Error while fetchin

754

【Kafka】安装与快速

487

649

flume读取日志数据写

639

Authentication plug

linux编程基础

710

如何在Python中过滤字符串列表

723

如何在Python中读写文件

736

初识Lambda表达式

795

深入理解Python中的列表推导..

1023

如何在Python中执行外部命令

1079

设计模式之单例模式理解

593

跟我学Python GUI编程系列 - ..

1355

21道并发编程面试题

606

深入理解 Hadoop 序列化

977

CAS无锁机制深入理解

C/C++面试题目

1216

KMP 字符串匹配学习

570

【Qt6】列表模型——

895

2.10 PE结构：重建重

621

695

2.12 PE结构：实现PE

560

2.14 PE结构：地址之

972

使用Vulkan-Loader将

612

4.1 应用层Hook挂钩

634

4.3 IAT Hook 挂钩技

545

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3