版权声明:尊重原创,转载请标明,本文转自 https://blog.csdn.net/high2011/article/details/51596853
1:在hh15\hh16\hh17上启动hbase集群:
先启动zookeeper-3.4.6:#sh/home/zookeeper-3.4.6/bin/zkServer.shstart
再启动hdfs:
#start-dfs.sh
#start-yarn.sh
最后启动hbase:#start-hbase.sh
2:设计索引库的settings信息和mappings信息,并把这些配置信息保存到一个配置文件中。
在hh15的/opt/soft/目录下编写bjcom.json文件
vibjcom.json
{
"settings":{
"number_of_shards":5,
"number_of_replicas":0
},
"mappings":{
"doc":{
"dynamic":"strict",
"properties":{
"id":{"type":"integer","store":"yes"},
"title":{"type":"string","store":"yes","index":"analyzed","analyzer":"ik_max_word","search_analyzer":"ik_max_word"},
"describe":{"type":"string","store":"yes","index":"analyzed","analyzer":"ik_max_word","search_analyzer":"ik_max_word"},
"author":{"type":"string","store":"yes","index":"no"}
}
}
}
}
3:安装配置es服务。
1):即整合IK中文分词工具
4:启动es
5:创建索引库
使用开始定义的文件进行创建,使用下面命令进行创建
#curl-XPOST'http://hh15:9200/bjcom'-d@bjcom.json
删除索引
#curl-XDELETE'http://hh15:9200/bjcom'
查询是否正常
#curl-XGET'http://hh15:9200/bjcom'
6:创建hbase表:
#create'doc','cf1'
7:利用”G:\testhbase\doc.txt”文件创建索引
打开idea15,添加项目:es_hbase_new,然后启动tomcat项目
在浏览器访问:
#curl'http://192.168.1.28:8080'
再创建索引:
#curl'http://192.168.1.28:8080/create.do'
再搜索万度一下:
#curl'http://192.168.1.28:8080/search.dokeyWords=2008&pageNum=1'
再模拟点击查看详情
#curl'http://192.168.1.28:8080//detailDocById/2.do'
(以下5是参考他人意思)
5:初始化数据
把原始数据在es中建立索引,并且还要在hbase中保存一份。
需要使用提供的代码里面的一个类(DataImportAndIndex.java)
1:使用hbaseutils工具类的时候,要注意修改zk的IP地址和hbase.rootdir的地址
conf.set("hbase.zookeeper.quorum","192.168.142.115:2181");
/**
*注意:如果使用这个地址无法访问的话请尝试使用这个
*hdfs://chenkl/hbase
*因为hadoop这边做了HA,现在主为197,备为196
*/
conf.set("hbase.rootdir","hdfs://chenkl/hbase");
还需要修改本机的hosts文件,不然hbase工具类无法正常调用
2:使用es工具类的时候要注意:
修改es的ip地址
addIndex方法需要实现