设为首页 加入收藏

TOP

使用kettle向HBase导入数据
2018-11-28 17:31:36 】 浏览:491
Tags:使用 kettle HBase 导入 数据
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wenjiangchun/article/details/50163123

kettle下载地址: 点击打开链接

kettle是一个ETL数据抽取转换工具,并且在数据转换中提供了大数据支持.下面例子测试将数据从Oracle库表中导入到HBase中.

  1. 首先将oracle数据库驱动程序放到${data-integration}/lib下
  2. 修改${data-integration}/plugins/pentaho-big-data-plugin/plugin.properties文件中active.hadoop.configuration属性,将该属性值设置为
    active.hadoop.configuration=hdp22
  3. 打开${data-integration}/spoon.sh,新建一个转换,转换包含一个表输入和HBase输出:如下图所示:


表输入内容如下:




HBase Output配置如下:

  • URL to hbase-site.xml中选择Hbase下的配置文件:hbase-site.xml
  • 点击"Get table names"可以获取hbase下的表.
  • Hadoop cluster配置如下:



  • 在"Create/Edit mappings"标签栏中配置字段转换规则:

其中info为Hbase表"Article"中的列簇

4.最后保存转换并运行


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Hbase 日常运维 下一篇HBase数据库使用TTL清理过期数据

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目