es elasticsearch 八 mapping 映射 、复杂数据类型

news2024/11/28 12:35:58

目录

Mapping 映射

复杂数据类型


Mapping 映射

精确匹配

必须和对应字段值安全一致才可查出

全文检索

缩写搜索全程、格式转换 大小写 同义词

全文检索核心原理

分词,初步的倒排索引的建立

重建倒排索引

时态转换、重复数的转换、同义词的转换、大小写的转换

分词器 analyzer

对单词:切分词语、正规化操作

目的是为了:Recall 召回率 增加返回结果

实现步骤:

1.Character 文本分词预处理解析内容

2.tokenizer 分词

3.token filter :过滤掉无用此内容加转化标准化词

       如中文了的呢 是无用词

建立倒排索引

内置分词器

更多分词器可去官网查看

Standard analyzer 标准分词器  standard

Simple analyzer 简单分词器

特定语言分词器

测试分词器

get /_analyze

{ "analyzer":"standard",

  "text":" Text to  analyze 70"

}

Mapping回顾总结

往es 插入数据 es 会自动建立索引,同时建立对应的mapping动态映射

Mapping中定义类每个 字段的数据类型

不同的数据类型有不同的检索方式 全文检索 准确检索

准确的值倒排索引会全值进入,全文检索,会先分词,再到倒排索引分别检索

Es 还可以自己建立mapping 动态映射,索引行为、分词器等

核心数据类型   

String 、byte、short number object geo-print/素组等、更多的看官方文档

动态映射推测规则

True -》boolean

123 -> long

“xxx” - > text/keyword

2019-01-01 -> date

查看 mapping

Get /text/_mapping

手动创建索引映射(定义分词器、数据类型、时间格式化)

delete book

put book

#keyword 不进行分词准确查询

put book/_mapping

{

  "properties":{

    "name":{

      "type":"text",

      "analyzer":"english",

      "search_analyzer":"english"

    },"pic":{

      "type":"keyword"

    },"timestamp":{

      "type":"date",

      "format":"yyyy-MM-dd"

    }

  }

}

put /book/_doc/4

{"name":"text hello word","pic":"998s"

  ,"timestamp":"2023-02-01"

}

get /book/_doc/3

get /book/_search?q=name:text

新增映射mapping

put book/_mapping

{

  "properties":{

    "new_filed":{

      "type":"text"

    }

  }

}

复杂数据类型

数组

空数据

对象

ok

持续更新

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/572851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

公文写作素材:工作落实类过渡句50例

1.再美的发展蓝图,如果不能落到实处,都是纸上谈兵;再大的奋进决心,如果没有实际行动,对工作毫无益处。 2.会议提出的任务再明确不落实只是纸上谈兵,会议出台的措施再可行不担当只是空中楼阁。 3.既要有不…

buildroot简介

网址 官网:https://buildroot.org/ 下载地址:https://buildroot.org/download.html 使用 解压后,执行make menuconfig Target options (目标板配置) Target Architecture: 目标架构&#…

SpringCloud微服务踩坑系列-java.lang.IllegalStateException

异常如下: 2023-05-24 08:47:10.764 ERROR 118400 --- [nio-8084-exec-1] o.a.c.c.C.[.[.[/].[dispatcherServlet] : Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exceptio…

1978-2020年337个城市的原材料储备量数据

铜、钢、铝、木材、水泥等原材料是城市建设和经济发展的必备物质!厘清原材料的储备情况对于经济发展、资源可持续利用等都具有重要意义! 我们发现在Springer Nature平台上分享有1978-2020年我国337个城市的原材料储备量数据!该数据包括了337…

《Spring Guides系列学习》guide16 - guide20

要想全面快速学习Spring的内容,最好的方法肯定是先去Spring官网去查阅文档,在Spring官网中找到了适合新手了解的官网Guides,一共68篇,打算全部过一遍,能尽量全面的了解Spring框架的每个特性和功能。 接着上篇看过的gu…

【微博-计算Cell子控件的frame Objective-C语言】

一、计算Cell子控件的frame 1.来,看一下,刚才我们已经做到把这个模型设置给自定义的cell了吧, 那么,在这个自定义Cell里面呢,我们是不是要开始设置数据了, 设置数据,我们,设置数据,其实很简单,就是把我们这里边的每一个控件,对应的值,从模型里面取出来,给了它,…

挂耳式耳机品牌排行榜,看看谁被推荐上榜

下班路上就想放空自己刷会儿视频,但是马路、地铁还有公交上都会有嘈杂的声音影响,如果佩戴入耳式耳机放大声音不仅会过度屏蔽外界,同时还会损伤我们的耳朵,所以新近流行的开放式耳机很好的解决了这些问题,但也有很多小…

智安网络|如何做好网络漏洞管理?这几点一定要了解!

随着网络技术的不断发展和应用,网络安全已经成为了各个企业、机构、甚至个人都需要面对和解决的难题。而在网络安全中,漏洞管理是非常重要的一个方面。本文将阐述网络安全中漏洞管理的相关知识和如何有效地进行漏洞管理。 一、漏洞管理的定义 漏洞是指软…

5.YAML介绍

什么是YAML? YAML是一种存储数据的文件格式。类似json和xml。 Ansible playbooks或者配置文件,以称为YAML的特定格式编写。如果您使用过其他数据结构格式(如XML或JSON),则应该能够轻松地使用它。 上图中就是以3种格式表…

找不到vcruntime140.dll,无法继续执行代码,vcruntime140.dll怎么修复

vcruntime140.dll是一个Microsoft Visual C Redistributable包的一部分,它是用于运行在Windows操作系统上使用Visual C开发的程序和应用程序的必备文件之一。它是Microsoft Visual C Redistributable的动态链接库文件,也就是所谓的DLL文件。如果这个文件…

nova 11系列可打断动画闪亮登场,带你领略极致丝滑体验

华为nova 11系列手机自发布以来就受到广大消费者的好评和青睐,尤其是全网热捧的丝滑流畅动效体验,更是让不少用户直呼——“一旦上手,就回不去了”,让我们先来欣赏一下nova 11系列上的动效吧! 从上面的视频演示&#x…

C++学习day--12 循环的应用,暴力破解密码和输出动图

第 1 节 职场修炼:程序员到底能干多久 现状: 很多程序员,过了 30 岁,纷纷转行。 原因: 1 )薪资过万后,很难进一步提升 2 )可替代性高,在新人面前,没有…

学习ChatGPT,从这几个中文提示词教程开始

ChatGPT已经火爆了一段时间了,很多用户也体验了ChatGPT,他的回答非常的强大。但有些人能够得到很好地回答,有些人得到的答案,并不是非常的完美,其实这个短时间内,和一个叫做提示工程(Prompt Eng…

在城市之间“闪送”,同城即时速递的正确解法

从5月14日母亲节到“520”网络情人节,鲜花店、餐饮店和蛋糕店里,满是闪送骑手师傅进进出出的身影。 在成都,一位闪送师傅通过抖音展示了自己忙碌的一天:“了不起的母亲节,凌晨就开始预约单,(系…

SSM框架学习-REST内容、案例及快速开发

1. REST简介 当访问行为不同时(例如insert、delete等等),REST风格描述形式的路径是相同的,那如何区分? 所以,通过路径请求方式,我们就可以区分对资源进行了何种操作; 而REST风格对资…

[PyTorch][chapter 35][经典卷积神经网络-1 ]

前言: ILSVRC(ImageNet Large Scale Visual Recognition Challenge)是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平。 ImageNet数据集是ILSVRC竞赛使用的是数据集,由斯坦福大学李…

太强啦!!!ChatGPT 能上传文件了,能执行 Python 代码啦!

ChatGPT又出试验型新模式,不少网友陆续收到代码解释器Alpha测试资格。 ​ 简单来说,这个模式提供两个功能:执行Python代码,接受文件上传下载。 为什么是这两个功能的组合? 可以看目前最火的一条测试结果&#xff0c…

MySQL——锁:概述、全局锁、表级锁、表锁(读锁、写锁)、元数据锁、意向锁、行级锁、行锁、间隙锁临键锁

5.锁 5.1 概述 ​ **锁是计算机协调多个进程或线程并发访问某一资源的机制。**在数据库中,除传统的计算资源(CPU、 RAM、I/O)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必…

Linux---用户切换命令(su命令、sudo命令、exit命令)

1. su命令 root用户拥有最大的系统操作权限,而普通用户在许多地方的权限是受限的。 普通用户的权限,一般在其HOME目录内是不受限的。 一旦出了HOME目录,大多数地方,普通用户仅有只读和执行权限,无修改权限。 su 是…

chatgpt国内镜像有什么优势?Gpt有什么强大的功能

chatgpt国内镜像有什么优势?其实这个是很多人都想知道的问题,小编觉得有必要给大家说一下,毕竟这个东西有优点也有缺点,下面我们一起来看看吧。 一.chatgpt国内镜像的优势 1.网络延迟更低 使用国内的ChatGPT镜像,可…