列
Sql Server全文索引实例(三)
sp_fulltext_column 'authors','au_lname','add'
sp_fulltext_column 'authors','au_fname','add'
step5. 激活该表上的全文本索引
sp_fulltext_table 'authors','activate'
step6. 启动全文本目录 www.2cto.com
sp_fulltext_catalog 'ftcPubsTest','start_full'
CONTAINS 语法
我们通常在WHERE 子句中使用CONTAINS ,就象这样:SELECT * FROM table_name WHERE CONTAINS(fullText_column,'search contents')。
我们通过例子来学习,假设有表students,其中的address 是全文本检索的列。
1. 查询住址在北京的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'beijing' )
remark: beijing是一个单词,要用单引号括起来。
2. 查询住址在河北省的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"HEIBEI province"' )
remark: HEBEI province是一个词组,在单引号里还要用双引号括起来。
3. 查询住址在河北省或北京的学生
SELECT student_id,student_name
FROM students www.2cto.com
WHERE CONTAINS( address, '"HEIBEI province" OR beijing' )
remark: 可以指定逻辑操作符(包括AND ,AND NOT,OR )。
4. 查询有'南京路' 字样的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'nanjing NEAR road' )
remark: 上面的查询将返回包含'nanjing road','nanjing east road','nanjing west road' 等字样的地址。
A NEAR B,就表示条件:A 靠近B。
5. 查询以'湖' 开头的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"hu*"' )
remark: 上面的查询将返回包含'hubei','hunan' 等字样的地址。
记住是*,不是%。
www.2cto.com
6. 类似加权的查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'ISABOUT (city weight (.8), county wright (.4))' )
remark: ISABOUT 是这种查询的关键字,weight 指定了一个介于0~1之间的数,类似系数(我的理解)。表示不同条件有不同的侧重。
7. 单词的多态查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'FORMSOF (INFLECTIONAL,street)' )
remark: 查询将返回包含'street','streets'等字样的地址。
对于动词将返回它的不同的时态,如:dry,将返回dry,dried,drying 等等。
以上例子都使用英文,不使用中文是因为有的查询方式中文不支持,而且我的计算机是英文系统
www.2cto.com
付:对《全文检索得质疑》:
5. 更新全文本索引的过程比常规索引要耗时,而且也不象常规索引那样可以由数据库系统立即更新。
可以立即更新的
9. 如果在查询中包含noise words ,就会引发错误,在应用程序中应去除这些noise words。
不对,查询时会自己过滤掉noise word,只有查询的内容全是noise words时才会出现错误
CONTAINSTABLE 语法
我们通常在FROM 子句中使用CONTAINSTABLE ,就象这样:SELECT * FROM table_name,CONTAINTABLE(fulltext_table,fullText_column,'search condition') WHERE ......。
CONTAINSTABLE 在查询方式上与CONTAINS 几乎一样,所以就不用赘述了。CONTAINSTABLE 返回的是符合查询条件的表,在SQL 语句中我们可以把它当作一个普通的表来使用。
www.2cto.com
我们看一个例子,比较这两种表的不同。
SELECT FT_TBL.student_name,FT_TBL.student_score,KEY_TBL.RANK
FROM report AS FT_TBL INNER JOIN
CONTAINSTABLE( student,address,
'ISABOUT (city weight (.8), county wright (.4))' ) AS KEY_TBL
ON FT_TBL.student_id = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK
CONTAINSTABLE 返回的表包含有特殊的两列:KEY,RANK。
在第一部分里我们就强调了:被全文索引的表必须有唯一索引。这个唯一的索引列在返回的表中就成为KEY。我们通常把它作为表连接的条件。
www.2cto.com
在某些网站搜索时,结果中会出现表示匹配程度的数字,RANK 与此类似。它的值在~1000之间,标识每一行与查询条件的匹配程度,程度越高,RANK 的值大,通常情况下,按照RANK 的降序排列。
FREETEXT 语法
FREETEXT 与CONTAINS 类似,只是没有CONTAINS 的精度高。在CONTAINS 中,对查询条件的写法有很多要求,而FREETEXT 就没有,可以是任意的单词,词组或句子。看下面的例子:
SELECT CategoryName
FROM Categories
WHERE FREETEXT (Description, 'sweetest candy bread and dry meat' )
www.2cto.com
FREETEXTTABLE 语法
和CONTAINSTABLE 一样,FREETEXTTABLE 返回带有KEY,RANK 的表。举例说明:
SELECT FT_TBL.Cate