Elasticsearch(十)搜索---搜索匹配功能①--查询所有文档和term级别查询

news2024/11/26 9:39:15

一、前言

之前的学习我们已经了解了搜索的辅助功能,从这一章开始就是ES真正核心的功能,搜索。针对不同的数据类型,ES提供了很多搜索匹配功能:既有进行完全匹配的term搜索,也有按照范围匹配的range搜索;既有进行分词匹配的match搜索,也有按照前缀匹配的suggesr搜索。我们同样也会通过在kibana上进行DSL的搜索示例,也会给出java客户端的使用代码。本节我们将介绍两个场景:查询所有文档和term级别的查询。

二、查询所有文档

在关系型数据库中,当需要查询所有文档的数据时,对应的SQL语句为select * from table_name.在ES中是否有类似的功能呢?答案是肯定的,使用ES的match_all查询可以完成类似的功能。使用match_all查询文档时,ES不对文档进行打分计算,默认情况下给每个文档赋予1.0的得分。用户可以通过boost参数设定该分值。以下示例使用match_all查询所有文档,并设定所有文档分值为2.0:

GET /hotel/_search
{
  "_source": ["title","city"],  //只返回title和city字段
  "query": {
    "match_all": {   //查询所有文档
      "boost": 2     //设定所有文档的分值为2.0
    }
  }
}

ES返回的数据如下:

{
 ...
 "hits" : {
    "total" : {
      "value" : 6,  //命中6个文档
      "relation" : "eq"
    },
    "max_score" : 2.0,
    "hits" : [
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "001",
        "_score" : 2.0,  //最高分为2.0
        "_source" : {    //命中的文档集合
          "city" : "北京",
          "title" : "文雅酒店"
        }
      },
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "002",
        "_score" : 2.0,
        "_source" : {
          "city" : "北京",
          "title" : "京盛酒店"
        }
      },
      ...
    ]
  }
}

通过返回的数据集可以看到,ES返回所有的文档,并且所有文档的得分都为2.0
在Java客户端进行查询时,可以调用QueryBuilders.matchAllQuery()方法新建一个match_all查询,并且通过boost()方法设置boost值。构建完term查询后,调用searchSourceBuilder.query()方法设置查询条件。
为方便演示,下面定义一个打印搜索结果的方法,该方法接收一个SearchRequest实例并将搜索结果设置查询条件。
由于我们的获取结果那一块儿,后面都是共同的,所以我们可以将这块儿代码独立出来:

	private List<Hotel> getQueryResult(SearchRequest searchRequest) throws IOException {
		ArrayList<Hotel> resultList = new ArrayList<>();
		SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
		RestStatus status = searchResponse.status();
		if (status != RestStatus.OK) {
			return Collections.emptyList();
		}
		SearchHits searchHits = searchResponse.getHits();
		for (SearchHit searchHit : searchHits) {
			Hotel hotelResult = new Hotel();
			hotelResult.setId(searchHit.getId());   //文档_id
			hotelResult.setIndex(searchHit.getIndex());   //索引名称
			hotelResult.setScore(searchHit.getScore());   //文档得分
			//转换为Map
			Map<String, Object> dataMap = searchHit.getSourceAsMap();
			hotelResult.setTitle((String) dataMap.get("title"));
			hotelResult.setCity((String) dataMap.get("city"));
			String price = (String) dataMap.get("price");
			if (StrUtil.isNotBlank(price)) {
				hotelResult.setPrice(Double.valueOf(price));
			}
			resultList.add(hotelResult);
		}
		return resultList;
	}

然后我们可以在service层使用match_all查询:

public List<Hotel> matchAllQuery(HotelDocRequest hotelDocRequest) throws IOException {
		String indexName = hotelDocRequest.getIndexName();
		if (CharSequenceUtil.isBlank(indexName)) {
			throw new SearchException("索引名不能为空");
		}
		//新建搜索请求
		SearchRequest searchRequest = new SearchRequest(indexName);
		SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
		//这里我直接New MatchAllQueryBuilder,不过更推荐QueryBuilders.matchAllQuery().boost(2.0f)
		//新建match_all查询,并设置boost值为2.0
		searchSourceBuilder.query(new MatchAllQueryBuilder().boost(2.0f));
		searchRequest.source(searchSourceBuilder);
		return getQueryResult(searchRequest);
	}

在controller层调用service:

	@PostMapping("/query/match_all")
	public FoundationResponse<List<Hotel>> matchAllQuery(@RequestBody HotelDocRequest hotelDocRequest) {
		try {
			List<Hotel> hotelList = esQueryService.matchAllQuery(hotelDocRequest);
			if (CollUtil.isNotEmpty(hotelList)) {
				return FoundationResponse.success(hotelList);
			} else {
				return FoundationResponse.error(100,"no data");
			}
		} catch (IOException e) {
			log.warn("搜索发生异常,原因为:{}", e.getMessage());
			return FoundationResponse.error(100, e.getMessage());
		} catch (Exception e) {
			log.error("服务发生异常,原因为:{}", e.getMessage());
			return FoundationResponse.error(100, e.getMessage());
		}
	}

postman调用该接口:
在这里插入图片描述

三、term级别查询

3.1、term查询

term查询是结构化精准查询的主要查询方式,用于查询待查字段和查询值是否完全匹配,其请求形式如下:

GET /hotel/_search
{
  "query": {
    "term": {
      "${FIELD}": {     //搜索字段名称
        "value": "${VALUE}"  //搜索值
      }
    }
  }
}

其中,FIELD和VALUE分别代表字段名称和查询值,FIELD的数据类型可以是数值型,布尔型、日期型、数组型及关键字等。
例如,下面的例子是查找city为北京的酒店,DDL如下:

GET /hotel/_search
{
  "_source": ["title","city"],     //希望返回的结果字段
  "from": 0,                        //分页
  "size": 10001,  
  "query": {
    "term": {
      "city": {    //搜索字段是city,字段类型为keyword
        "value": "北京"
      }
    }
  }
}

返回结果如下:
在这里插入图片描述
对于日期型的字段查询,需要按照该字段在mappings中定义的格式进行查询。如果格式不对,那么请求将报错:
例如我这边create_time的格式是yyyy-MM-dd HH:mm:ss
在这里插入图片描述
如果我拿其他格式进行请求:

GET /hotel/_search
{
  "_source": ["title","city"],
  "query": {
   "term": {
     "create_time": {
       "value": "20230121142456"
     }
   }
  }
}

会发现报错
在这里插入图片描述
在java客户端中进行查询时,可以调用QueryBuilders.termQuery()方法新建一个term查询,可以传入boolean、double、float、int、long和String等类型的参数,但是没有日期类型的参数,如下图所示:
在这里插入图片描述
那么如何构建日期类型的term查询呢?可以使用日期格式字符串类型的term查询来解决。以下为使用日期类型的字符串参数构建的term查询:我们传参一般是date类型,这个时候我们将传过来的fate类型通过simpleDateFormat对传参的date进行转化,即可顺利进行查询。

	public List<Hotel> getCityByCreateTime(HotelDocRequest hotelDocRequest) throws IOException {
		String indexName = hotelDocRequest.getIndexName();
		if (CharSequenceUtil.isBlank(indexName)) {
			throw new SearchException("索引名不能为空");
		}
		Hotel hotel = hotelDocRequest.getHotel();
		if (ObjectUtil.isEmpty(hotel)) {
			throw new SearchException("搜索条件不能为空");
		}
		SearchRequest searchRequest = new SearchRequest(indexName);
		//创建搜索builder
		SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
		//构建query
		String createTimeToSearch = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format( hotel.getCreateTime());
		searchSourceBuilder.query(QueryBuilders.termQuery("create_time",createTimeToSearch));
		//设定希望返回的字段数组
		searchRequest.source(searchSourceBuilder); //设置查询
		return getQueryResult(searchRequest);
	}

以下是postman调用例子
在这里插入图片描述

3.2、terms查询
terms查询是term查询的扩展形式,,用于查询一个或多个值与待查字段是否完全匹配,请求形式如下:

GET /hotel/_search
{
   "query": {
    "terms": {
      "FIELD": [
           "VALUE1",
           "VALUE2"
        ]
        
    }
  }
}

其中,FIEKD代表待查字段名,VALUE1和VALUE2代表多个查询值,FIELD的数据类型可以是数值型,布尔型,日期型,数组型及关键字等。
以下是搜索城市为北京或者上海的酒店示例:

GET /hotel/_search
{
  "_source": ["title","city"],
  "from": 0,
  "size": 10001, 
  "query": {
    "terms": {
      "city": [
           "北京",
           "上海"
        ]
        
    }
  }
}

在这里插入图片描述
在java客户端中对应terms查询的类为TermsQuery,该类的实例通过QueryBuilders.termsQuery()生成。在QueryBuilders.termsQuery()方法中,第一个参数为字段名称,第二个参数是一个集合类型,也可以是一个单独类型,当为单独类型时,该参数为可变长度参数。QueryBuilders.termsQuery()方法列表如下图:
在这里插入图片描述
以下是使用java进行terms查询城市为北京或者上海的酒店示例:
Service层,我们接收一个citys数组参数

	public List<Hotel> termsQuery(HotelDocRequest hotelDocRequest) throws IOException {
		//新建搜索请求
		String indexName = hotelDocRequest.getIndexName();
		if (CharSequenceUtil.isBlank(indexName)) {
			throw new SearchException("索引名不能为空");
		}
		SearchRequest searchRequest = new SearchRequest(indexName);
		SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
		List<String> cities = hotelDocRequest.getCities();
		searchSourceBuilder.query(QueryBuilders.termsQuery("city", cities));
		searchRequest.source(searchSourceBuilder);
		return getQueryResult(searchRequest);
	}

controller层:

	@PostMapping("/query/terms")
	public FoundationResponse<List<Hotel>> termsQuery(@RequestBody HotelDocRequest hotelDocRequest) {
		try {
			List<Hotel> hotelList = esQueryService.termsQuery(hotelDocRequest);
			if (CollUtil.isNotEmpty(hotelList)) {
				return FoundationResponse.success(hotelList);
			} else {
				return FoundationResponse.error(100,"no data");
			}
		} catch (IOException e) {
			log.warn("搜索发生异常,原因为:{}", e.getMessage());
			return FoundationResponse.error(100, e.getMessage());
		} catch (Exception e) {
			log.error("服务发生异常,原因为:{}", e.getMessage());
			return FoundationResponse.error(100, e.getMessage());
		}
	}

postman执行,发现搜索成功:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/666578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文让你学会接口自动化测试框架!

目录 前言&#xff1a; 自动化测试 接口自动化测试的价值 接口自动化测试如何开展 接口自动化测试框架 前言&#xff1a; 接口自动化测试是指利用程序自动化地执行API接口测试&#xff0c;可以提高测试效率和准确性。 自动化测试 自动化测试&#xff0c;这几年行业内的…

一个悄然崛起的AI开源项目!

众所周知&#xff0c;最近这半年AI相关的话题实在是火到出圈。尤其是生成式AI的流行&#xff0c;让我们普通人也可以近距离地接触和应用AI。这其中最典型的就是ChatGPT。 那除了ChatGPT&#xff0c;还有一个非常实用的领域&#xff0c;也是我们今天要讨论的话题&#xff0c;那…

​低代码让传统软件开发土掉渣了

正所谓“让机器去做无聊的事情&#xff0c;让人类去创造美好的事物”。 在当今数码化时代&#xff0c;企业如何更快捷、高效的开发应用是众所周知的难题。传统开发方式需要多名开发人员耗费大量时间精力开发&#xff0c;期间还需要经历漫长的测试和上线过程。 要在这个竞争激烈…

AI绘图软件分享:Midjourney 基础教程(二)

大家好&#xff0c;我是权知星球&#xff0c;今天继续给大家介绍AI绘图软件分享&#xff1a;Midjourney 基础教程&#xff08;二&#xff09; ⼀、Midjourney 服务器介绍 1.Discord 软件介绍 Midjourney AI 绘画服务基于 Discord 软件的&#xff0c;它的绘画功能&#xff0c;…

【AUTOSAR】UDS协议的代码分析与解读(十一)----UDS例程控制31h请求下载 34h

8.15 例程控制 RoutineControl (31h) 此服务用于启动程序 、停止程序和请求程 序执行结果。例程由 两字节的例程标识符 (RoutineIdentifier)来确定。 8.15.1 报文格式 表 71 例程控制服务的请求报文 Byte Name Cvt Value (Hex) #1 RequestServiceIdentifier M 31 #2 …

部署运行jar包方法全解docker镜像打包部署等

基本方法 java -jar 对应的jar包名字 永久后台方法 有一种叫做“nohup”的命令&#xff0c;该命令可以让您的应用程序在后台运行&#xff0c;即使您已经断开了与终端的连接也能保持运行状态。 nohup 命令的语法为&#xff1a; nohup command arg1 arg2 ... argN &其中…

金三银四互联网大厂秋招精选 1160 道 Java 面试题答案整理(2023 最新版)

今年的大环境而言&#xff0c;面试成功的难度比往年高了很多&#xff0c;很明显的感受就是&#xff1a;对于今年的 java 开发朋友面试&#xff0c;无论一面还是二面&#xff0c;都开始考验一个 Java 程序员的技术功底和基础。Java 基础掌握不牢&#xff0c;对于一个开发人员来说…

北斗高精度定位赋能智慧港口,千寻位置解决方案落地应用

港口是交通运输的重要节点&#xff0c;也是国家经济发展的重要支撑&#xff0c;其作业效率直接影响着运营效益。随着全球数字化技术的不断革新&#xff0c;我国港口逐渐从传统模式向智能化、数字化的“智慧模式”转变。在这一转型过程中&#xff0c;高精度技术应用的作用愈发重…

伊朗上下5000年简史

提起伊朗&#xff0c;你脑海中首先浮现的是什么&#xff1f; 混乱、保守、战争&#xff1f;穆斯林&#xff1f;抑或是石油&#xff0c;核武器&#xff1f; 这些附着在伊朗头上的标签&#xff0c;使很多人忽略了&#xff0c;它是一个拥有着5000年历史的文明古国&#xff1b;在…

保护视力的软件:定时提醒你休息的桌面工具EyeLeo

文章目录 保护视力的软件&#xff1a;定时提醒你休息的桌面工具EyeLeo什么是EyeLeo为什么要使用&#xff1f;它为什么如此重要&#xff1f;EyeLeo特征 使用说明 保护视力的软件&#xff1a;定时提醒你休息的桌面工具EyeLeo 什么是EyeLeo 官网&#xff1a;http://www.eyeleo.c…

django新手教程

Django简介 Django是开源的、大而且全的Web应用框架。 它独具特色&#xff0c;采用了MTV设计模式。 它也是一款用来构建服务器的框架。这一概念如何理解呢&#xff1f; 应用程序有两种模式&#xff1a;C/S、B/S。 C/S是客户端与服务器端&#xff0c;这类程序一般能独立运行…

【Python】高级语法:推导式、迭代器、生成器、装饰器

原文作者&#xff1a;我辈李想 版权声明&#xff1a;文章原创&#xff0c;转载时请务必加上原文超链接、作者信息和本声明。 文章目录 一、推导式1.列表推导式2.集合推导式3.字典推导式 二、迭代器三、生成器1.yield 生成器2.元组生成器3.生成器中重要方法 四、装饰器1.函数装饰…

谈谈电商API!

近年来&#xff0c;随着互联网和移动互联网技术的不断发展&#xff0c;电商行业成为了一种新兴的商业模式。电商平台实现了互联网和商品销售的深度融合&#xff0c;成为经济社会发展的重要组成部分。而电商API&#xff08;Application Programming Interface, 应用程序接口&…

RobotFrameWork Web自动化测试之测试环境搭建

前言 Robot Framework是一款python编写的功能自动化测试框架。具备良好的可扩展性&#xff0c;支持关键字驱动&#xff0c;可以同时测试多种类型的客户端或者接口&#xff0c;可以进行分布式测试执行。主要用于轮次很多的验收测试和验收测试驱动开发&#xff08;ATDD&#xff…

自然语言处理实战项目11-阅读理解项目的数据处理与训练详细讲解,实验结果与分析

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下自然语言处理实战项目11-阅读理解项目的数据处理与训练详细讲解&#xff0c;阅读理解任务目标是让计算机从给定的文章中理解并回答问题。为了完成这个任务&#xff0c;我们需要对给定的数据进行处理和训练。该任务是…

项目调研丨多区块并行处理公链 Transformers 研究报告

目录 一、项目简介 二、项目愿景 三、特色和优势 &#xff08;1&#xff09;速度 &#xff08;2&#xff09;安全 &#xff08;3&#xff09;可扩展性 &#xff08;4&#xff09;高度定制 &#xff08;5&#xff09;不可篡改 &#xff08;6&#xff09;所有数据公开透…

怎么防止数据重放攻击——CBC模式【密码学】(7)

目录 一、什么是CBC模式 二、初始化向量 三、异或运算 四、密钥少一位会有影响吗 一、什么是CBC模式 CBC模式中&#xff0c;明文分组在加密前&#xff0c;要与前一组的密文分组进行异或运算&#xff0c;异或运算的结果参与加密函数的运算。 每一个密文分组&#xff0c;都…

解决谷歌翻译无法使用

谷歌翻译无法使用是谷歌官方关闭了中国地区翻译服务。 废话不多说直接上教程&#xff0c;本质就是通过修改hosts文件让translate.googleapis.com域名的IP解析到国内的谷歌服务器IP&#xff0c;网上大部分的教程也是如此。 但是有个问题就是这个IP不稳定可能用了几天就不用了&am…

leetcode 150. 逆波兰表达式求值

2023.6.20 后缀表达式也是栈的经典应用&#xff0c;注意好细节就行&#xff0c;下面直接上代码&#xff1a; class Solution { public:int evalRPN(vector<string>& tokens) {stack<long long> stk;long long result 0;for(int i0; i<tokens.size(); i){i…

兼容性测试对于软件测试来说重要吗?

该测试是软件测试的一个重要部分&#xff0c;它也获得了越来越多的关注和重视。那么&#xff0c;兼容性测试对于软件测试来说重要吗&#xff1f;我们一起往下了解。 首先&#xff0c;兼容性测试可以确保软件在不同的操作系统、硬件平台和设备上能够正常运行。在产品开发过程中&…