参考此网页:http://www.php3.cn/a/130.html
首先,每一个cell里,可能包含多个时间戳的数据,
系统默认显示在时间范围内最新的那个。
在hbase里建立一个测试库,
根据网上的资料,实验如下,
首先我们要修改库的version,默认是1,当默认的情况下,是不会保留以前时间戳的数据的。
hbase shell
put 'lyx_test','wanglei','info:age','100'
put 'lyx_test','wanglei','info:age','101'
put 'lyx_test','wanglei','info:age','102'
当没设置version时,下行代码只显示了一行
get 'lyx_test','wanglei',{COLUMN=>'info:age',TIMERANGE=>[0,1487745602769],VERSIONS=>2}
设置version:
alter 'lyx_test',{NAME=>'info',VERSIONS=>2}
再执行上述put以及get后,发现能够显示两行
那么我要如何在java的MR代码中获取到包含所有版本时间戳的完整cell数据呢
在main里(或run里),在TableMapReduceUtil.initTableMapperJob之前声明的
Scan myscan=new Scan();后面增加此行代码
myscan.setMaxVersions();即可
原来的数据是这样的:
--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0}
增加以后,kv输出的数据格式变成这样
--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0, 2f1109b71037ae8ea86980/H:contact/86402/Put/vlen=2/seqid=0}
---------------------
作者:默-言
来源:CSDN
原文:https://blog.csdn.net/lyxuan1208/article/details/56488092
版权声明:本文为博主原创文章,转载请附上博文链接!