TOP

使用kettle向HBase导入数据
2018-11-28 17:31:36 】 浏览:627
Tags:使用 kettle HBase 导入 数据

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wenjiangchun/article/details/50163123

kettle下载地址: 点击打开链接

kettle是一个ETL数据抽取转换工具,并且在数据转换中提供了大数据支持.下面例子测试将数据从Oracle库表中导入到HBase中.

  1. 首先将oracle数据库驱动程序放到${data-integration}/lib下
  2. 修改${data-integration}/plugins/pentaho-big-data-plugin/plugin.properties文件中active.hadoop.configuration属性,将该属性值设置为
    active.hadoop.configuration=hdp22
  3. 打开${data-integration}/spoon.sh,新建一个转换,转换包含一个表输入和HBase输出:如下图所示:


表输入内容如下:




HBase Output配置如下:

  • URL to hbase-site.xml中选择Hbase下的配置文件:hbase-site.xml
  • 点击"Get table names"可以获取hbase下的表.
  • Hadoop cluster配置如下:



  • 在"Create/Edit mappings"标签栏中配置字段转换规则:

其中info为Hbase表"Article"中的列簇

4.最后保存转换并运行



使用kettle向HBase导入数据 https://www.cppentry.com/bencandy.php?fid=118&id=186859

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Hbase 日常运维 下一篇HBase数据库使用TTL清理过期数据