✎ 编程开发网

HBase学习总结(3)：HBase的数据模型及工作机制(二)

2015-07-24 06:31:54 · 作者: · 浏览: 137

标签: HBase 学习总结数据模型工作机制

能在get和scan命令中返回结果。因为HFile文件是不能改变的，直到执行一次大合并，这些墓碑记录才会被处理，被删除记录占用的空间才会被释放。
合并分为两种：大合并(major compaction)和小合并(minor compaction)。两种将会重整存储在HFile里的数据。小合并把多个小HFile合并生成一个大HFile。因为读出一条完整的行可能引用很多文件，限制HFile的数量对于读性能很重要。执行合并时，HBase读出已有的多个HFile的内容，把记录写入一个新文件。然后，把新文件设置为激活状态，删除构成这个新文件的所有老文件。HBase根据文件的号码和大小决定合并哪些文件。小合并设计出发点是轻微影响HBase的性能，所以涉及的HFile的数量有上限。这些都可以设置。小合并的示意如图4所示。
这里写图片描述

这里写图片描述

图4 小合并的示意图
大合并将处理给定region的一个列族的所有HFile。大合并完成后，这个列族的所有HFile合并成一个文件。可以从Shell中手工触发整个表(或者特定region)的大合并。这个动作相当耗费资源，不要经常使用。另一方面，小合并是轻量级的，可以频繁发生。大合并是HBase清理被删除记录的唯一机会。因为我们不能保证被删除的记录和墓碑标记记录在一个HFile里面，而大合并可以确保同时访问到两种记录。

首页上一页 1 2 下一页尾页 2/2/2

上一篇也谈SQLServer2008处理隐式数据类..

下一篇 Sql分割字符串