设为首页 加入收藏

TOP

关于HBase 中Scan扫描的优化(重要)
2019-01-06 01:49:07 】 浏览:22
Tags:关于 HBase Scan 扫描 优化 重要
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/timchen525/article/details/77120471

1、由于Scan是全表扫描,任何时候,在使用Scan一定要加上StartRowKey和StopRowKey,限定扫描的范围。

3333333_

Filter prefilter

3333333_11111

3333333_22212

3333334_

3333333_ startrowkey

3333334_ stoprowkey

2、对于查询前缀的数据,不要去使用过滤器中的前缀匹配过滤器,在我们上面设计的RowKey中,只要对要查询的前缀字段转化为StartRowKey和StopRowKey,一个技巧比如:如果要查询前缀为:<userId>-<date>(具体形式比如为:000001_20170118),我们可以设计StartRowKey为000001_20170118_0以及StopRowKey为000001_20170119(注意:scan的StartRowKey、StopRowKey是左闭又开,所以不会返回这一列)

3、如果考虑网络传输,以及查询的时间,如果只需要特定的列簇信息或者列,可以指定只扫描特定的列簇或者列,可以提高性能。


编程开发网
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Hbase和Hive以及传统数据库的区别 下一篇hbase region is not online

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容:

array(4) { ["type"]=> int(8) ["message"]=> string(24) "Undefined variable: jobs" ["file"]=> string(32) "/mnt/wp/cppentry/do/bencandy.php" ["line"]=> int(214) }