Elasticsearch mapping

本篇主要介绍一下 Elasticsearch mapping 的概念, 它是什么以及如何自定义它, 并且再介绍一下 dynamic 的机制

如果把 Elasticsearch中的mapping 对比到 mysql 中就是 mysql中的表的 scheme , 就是表的定义结构,

正常在关系型数据库mysql中需要先把表的scheme 定义好再插入数据, 并且你无法插入未在scheme 中定义的字段 , 而 es 中可以在你未给索引定义 mapping 的时候自动帮你创建 mapping , 并且你也可以通过 dynamic 来控制是否允许灵活动态的添加 mapping中的属性

1.什么是Mapping

Mapping 类似 mysql 中的 schema 的定义,就是定义索引属性字段的
- 定义索引中字段的名称
- 定义索引中字段的数据类型 , 如 text , long , keyword....
- 定义索引中字段的的倒排索引相关配置 ( Analyzer...)
一个Mapping 属于一个索引的Type
- 每个文档都属于一个Type
- 一个Type有一个Mapping 定义
- es7.0开始, 在Mapping中不需要指定 Type信息, 因为7.0之后只有_doc Type

2.es 自动创建mapping

当我们去创建一个索引的时候未指定 mapping , es会默认帮这个索引创建一个 mapping

创建一个索引并且索引一条数据

PUT blog/_doc/1
{
  "name": "es mapping",
  "type": "es",
  "desc": "es mapping desc",
  "author": "johnny",
  "word_count": 50,
  "create_time": "2022-10-31"
}

GET blog/_mapping  # 查看一个 es自动生成的 mapping

从上面可以看出来属性都被es 自动创建了对应的mapping , 包括每个属性的type类型等, 那它为什么会这样转化的,什么时候是 text, 什么时候是 long 下面就来介绍 es 中mapping 的类型自动识别

3. mapping 类型自动识别

JSON类型	Elasticsearch 类型
字符串	1.匹配日期格式会设置成Date 2.匹配数字设置成 float 或者 long ,该选项默认关闭的 3.设置成Text , 并且添加 keyword 子字段
整数	long
浮点数	float
布尔值	boolean
对象	object
数组	由第一个非空数值的类型所定义 .如 ["jack","johnny"] 则类型为 Text
空值	忽略 ??? 我实验的版本里7.18 , 如果设置null 会被自动定义为Text , 具体不太清楚

4. 自定义创建mapping

除了上面的介绍的 es 自动创建 mapping 外, 还可以自定义索引的mapping , 更加灵活和符合业务需求等等.

注意以前的版本需要在 mappings 下面还有一层 type , 如 mappings: { "_doc" : { "properties" : {xxx} }} 但是7.0之后 type就不需要了

PUT blog_info
{
  "mappings": {
      "properties": {
        "blog_name": {
          "type": "keyword"
        },
        "blog_desc": {
          "type": "text"
        },
        "blog_word_count": {
          "type": "long"
        },
        "create_time": {
          "type": "date"
        }
      }
    }
}

其中text和keyword类型，text类型的字段在新增或修改文档时会自动分词, 而keyword 不会,它会保存插入的原始文本

索引一条数据

PUT blog_info/_doc/1
{
  "blog_name": "es mapping",
  "blog_desc": "es mapping desc",
  "blog_word_count": 12,
  "blog_auther": "johnny",
  "create_time": "2022-10-31"
}

5. mapping 属性设置analyzer 分词器

默认分词器 standard , 它会把中文一个个拆开,肯定是不适合的,如果是索引中文的信息, 需要设置字段的分词器,

PUT blog_info
{
  "mappings": {
      "properties": {
        "blog_desc": {
          "type": "text",
          "analyzer": "ik_smart" //设置这个字段的分词器 
        }
      }
    }
}

大部分分词器是需要以es 中插件的方式安装的 ,后续会出一篇专门的 analyzer 分词器

6. mapping 属性设置 boost 权重

在es搜索的时候会有一个相关性算分的过程 , 如果不设置每个字段的默认boost 权重为1.0 , 如果希望加大按照广告投放金额的分那么可以设置boost 以提高搜索自然就排在前面了

PUT blog_info
{
  "mappings": {
      "properties": {
        "put_amount": {
          "type": "text",
          "boost": "5" 
        }
      }
    }
}

7. mapping 属性设置 copy_to

该属性允许多个字段 copy 到指定的字段, 可以进行搜索这个字段,但是_source 中是不显示的

PUT peope
{
  "mappings": {
    "properties": {
      "first_name": {
        "type": "text",
        "copy_to": "full_name"
      },
      "last_name":{
        "type": "text",
        "copy_to": "full_name" /

首页上一页 1 2 3 下一页尾页 1/3/3
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：day08-XML	下一篇：java -- Stream流