设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 大数据 -> Flume

TOP

通过kafka，flume消费自己生产的数据到hbase的准备

2019-03-25 14:04:46 【大中小】浏览:85次

Tags：通过 kafka flume 消费自己生产数据 hbase 准备

1.启动zookeeper

2.启动kafka集群的broker服务

kafka-server-start.sh /home/hadoop/apps/kafka_2.11-1.1.0/config/server.properties

3.打开新的shell窗口创建主题

kafka-topics.sh --zookeeper ali:2181 --topic calllog --create --replication-factor 1 --partitions 3

4.验证主题正确性

如果之前已经执行过3 4 课不用执行直接启动flume

kafka-topics.sh --zookeeper ali:2181 --list

5.创建任务的配置文件并且启动flume

配置flume的job的conf -->>> flume-exec-kafka.conf

# define
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F -c +0 /home/hadoop/calllog/calllog.csv
a1.sources.r1.shell = /bin/bash -c

# sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.brokerList = ali:9092,tencent:9092,huawei:9092
a1.sinks.k1.topic = calllog
a1.sinks.k1.batchSize = 20
a1.sinks.k1.requiredAcks = 1

# channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# bind
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

一定要使用自己刚才自定义的配置信息

flume-ng agent \
-c conf \
-n a1 \
 -f /home/hadoop/calllog/flume-exec-kafka.conf \
-Dflume.root.logger=INFO,console

6.打包数据生产者的jar包到linux的calllog目录下

7.打开新的shell窗口启动控制台消费者，或者在idea中启动程序准备进行消费

kafka-console-consumer.sh --zookeeper ali:2181 --topic calllog --from-beginning

可以不用执行shell窗口验证，这一步骤只是用于验证

8.进入calllog文件夹启动生产数据的任务

java -cp ct_producer-1.0-SNAPSHOT.jar producer.ProductLog /home/hadoop/calllog/calllog.csv

可以写一个脚本

#!/bin/bash
java -cp /home/hadoop/calllog/ct_producer-1.0-SNAPSHOT.jar producer.ProductLog /home/hadoop/calllog/calllog.csv

等待一会之后开始消费数据

9.进入hbase查询数据是否写入

如果查询到自己插入的数据和协处理器插入的数据说明运行成功


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：flume 启动命令	下一篇：Flume Source组件实战—Avro、Spo..

最新文章

flume读取日志数据写入kafka ..

Authentication plugin 'cachin..

Flume 自定义source -- SQL..

flume 三大核心组件

ICC副本>>>>(logback+f..

热门文章

flume学习（1）

flume读取日志数据写入kafka ..

通过Flume拉取Kafka数据保存到ES

Authentication plugin 'cachin..

Flume抽取Oracle中的数据到Kafka

Hot 文章

flume学习（1）

flume读取日志数据写入kafka ..

通过Flume拉取Kafka数据保存到ES

Authentication plugin 'cachin..

Flume抽取Oracle中的数据到Kafka

Python

815

Django框架系列目录

652

创建Anaconda虚拟Pyt

1249

Python获取主目录的

886

Python中跨越多个文

540

chatgpt使用python写

737

一条爬虫抓取一个小

608

Python教程：sys.std

669

Python教程(13)——P

853

Docker安装配置Jupyt

736

【matplotlib基础】-

C 语言

534

C语言入坑总结

628

C数据结构-线性表之顺序表

1388

Programming abstractions in..

550

C语言内存布局

837

最全的李慧芹APUE-标准IO笔记

747

alog一个日志库

602

1.1.初识STM32及新建工程

801

codeblock安装及汉化教程

620

东方博宜OJ1000 熟悉一下Onli..

1347

关于指针与引用传递的效率问题

C++基础

1219

KMP 字符串匹配学习笔记

898

2.10 PE结构：重建重定位表结..

575

【Qt6】列表模型——抽象基类

698

2.12 PE结构：实现PE字节注入

624

563

2.14 PE结构：地址之间的转换

615

4.1 应用层Hook挂钩原理分析

976

使用Vulkan-Loader将ncnn代码..

637

4.3 IAT Hook 挂钩技术

548

C++ 学习笔记、01 | 开发简单..

大数据基础

1015

多线程：线程的同步

576

vertica-->kafka-

898

653

解决android studio

589

Kafka史上最详细原理

618

Error while fetchin

757

【Kafka】安装与快速

492

652

flume读取日志数据写

642

Authentication plug

linux编程基础

713

如何在Python中过滤字符串列表

725

如何在Python中读写文件

742

初识Lambda表达式

798

深入理解Python中的列表推导..

1026

如何在Python中执行外部命令

1082

设计模式之单例模式理解

595

跟我学Python GUI编程系列 - ..

1360

21道并发编程面试题

609

深入理解 Hadoop 序列化

981

CAS无锁机制深入理解

C/C++面试题目

1219

KMP 字符串匹配学习

575

【Qt6】列表模型——

898

2.10 PE结构：重建重

624

698

2.12 PE结构：实现PE

563

2.14 PE结构：地址之

976

使用Vulkan-Loader将

615

4.1 应用层Hook挂钩

637

4.3 IAT Hook 挂钩技

548

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3