mongodb全文搜索解决方案(lucene+IKAnalyzer) - 数据库编程

TOP

mongodb全文搜索解决方案(lucene+IKAnalyzer)(一)

2014-11-24 08:09:31 来源: 作者: 【大中小】浏览:11次

Tags：mongodb 全文搜索解决方案 lucene IKAnalyzer

mongodb全文搜索解决方案(lucene+IKAnalyzer)

mongodb 解决全文搜索是个不小的问题

可以用正则匹配但是效率很低往往到大数据量的搜索的时候就会出现查询超时等现象

当然也可以用官方的做法(在mongodb的文档类型中加字段,存分词结果,

然后从该字段中匹配) 但是我尝试了效率比原先的好像还要低

www.2cto.com

http://www.oschina.net/question/200745_61968

后来我尝试了 lucene+IKAnalyzer 发现效率有所提升啊

原理:lucene 把大文本的数据利用分词器在新建的索引文件中建立索引

取数据的时候从索引文件中取

取出mongodb 中的数据进行索引的创建

package sample3;

import java.io.File;

import org.apache.lucene.analysis.Analyzer;

06 www.2cto.com

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriter.MaxFieldLength;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.wltea.analyzer.lucene.IKAnalyzer;

import com.mongodb.DB;

import com.mongodb.DBCollection;

import com.mongodb.DBCursor;

import com.mongodb.Mongo;

/**

* 创建索引

* @author zhanghaijun www.2cto.com

public class Demo1 {

public static void main(String[] args) throws Exception {

//先在数据库中拿到要创建索引的数据

Mongo mongo = new Mongo();

DB db = mongo.getDB("zhang");

DBCollection msg = db.getCollection("test3");

DBCursor cursor = msg.find();

//是否重新创建索引文件，false：在原有的基础上追加

boolean create = true;

//创建索引

Directory directory = FSDirectory.open(new File("E:\\lucene\\index"));

35 www.2cto.com

Analyzer analyzer = new IKAnalyzer();//IK中文分词器

IndexWriter indexWriter = new IndexWriter(directory,analyzer,MaxFieldLength.LIMITED);

boolean exist = cursor.hasNext();

while(exist){

//System.out.println(cursor.next().get("text").toString());

Document doc = new Document();

Field fieldText = new Field("text",cursor.next().get("text").toString(),Field.Store.YES,

Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS);

doc.add(fieldText);

indexWriter.addDocument(doc);

exist = cursor.hasNext();

}

cursor = null;

//optimize()方法是对索引进行优化

indexWriter.optimize();

//最后关闭索引

indexWriter.close();

52 www.2cto.com

}

数据的查找(直接从索引文件中查找)

package sample3;

import java.io.File;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.store.FSDirectory;

import org.wltea.analyzer.lucene.IKAnalyzer;

import org.wltea.analyzer.lucene.IKQueryParser;

import org.wltea.analyzer.lucene.IKSimilarity;

15 www.2cto.com

首页上一页 1 2 3 下一页尾页 1/3/3
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】
分享到:
上一篇：Sqlite的简单介绍和应用	下一篇：Oracle私房菜之数据库基础交流

帐　　号:

密码: (新用户注册)

验证码:

表　　情:

内　　容: