ElasticSearch漫游 (5.RestClient初始化准备)

news2026/2/11 14:48:09

之前都是在客户端页面各种操作，但是我们作为一个java开发者，需要使用代码的方式来操作ES，所以我们要先从 Rest Client 开始

准备数据

既然是ES 查数据不整点测试数据没法下饭是吧先建个酒店表搞点数据：
在这里插入图片描述
（新手可能会好奇？我靠不是玩ES吗？？怎么扯到mysql里面来了，不着急我们先把数据放着到时候再弄进ES）

Rest Client

我们用redis 有jedis java客户端，用rabbitmq 也有AMQP ，用mysql有jdbc。那用ES 肯定也会有个java客户端对吧？它就是 java rest client。

我们做一部分准备工作包括idea 框架准备 mybatis依赖数据库建表导入数据，Rest Client依赖相关的都准备好。这些很简单就不赘述了

分析数据结构

首先我们在数据库中的旅店表 ddl是这样的：

CREATE TABLE `tb_hotel` (
  `id` bigint NOT NULL COMMENT '酒店id',
  `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店名称',
  `address` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店地址',
  `price` int NOT NULL COMMENT '酒店价格',
  `score` int NOT NULL COMMENT '酒店评分',
  `brand` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店品牌',
  `city` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '所在城市',
  `star_name` varchar(16) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店星级，1星到5星，1钻到5钻',
  `business` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '商圈',
  `latitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '纬度',
  `longitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '经度',
  `pic` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店图片',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci ROW_FORMAT=COMPACT;

在数据库里面大家都很熟悉，但是有没想过我们上一篇讲过的ES的数据是怎么存的？建索引库然后定义mapping，包括里面有哪些字段怎么定义是否加索引参与搜索，是否分词，分词器是什么？

这些就是我们把上面mysql的数据导入到ES中的时候需要考虑的：

我们来实践编写一下mapping：

PUT /hotel
{
  "mappings":{
    "properties":{
      "id":{
        "type":"keyword"
      },
      
      "name":{
        "type":"text",
        "analyzer":"ik_max_word",
        "copy_to": "all"
        
      },
      
      "address":{
        "type":"keyword",
        "index":false   
      },
      
      "price":{
        "type":"integer"
      },
      
      "score":{
        "type":"integer"
      },
      
      "brand":{
        "type":"keyword",
        "copy_to": "all"
      },
      
      "city":{
        "type":"keyword"
      },    
      
      "starName":{
        "type":"keyword"
      },     
            
      "business":{
        "type":"keyword",
        "copy_to": "all"
      },  
      
      "location":{
        "type":"geo_point"
      },   
      
      "pic":{
        "type":"keyword",
        "index":false   
      }, 
      
      "all":{
        "type":"text",
        "analyzer":"ik_max_word"        
      }
    }
  }
}

这个地方要按照上一篇 ES 索引库 mapping的理解来写，比如有的字段需要分词那么就text+分词器。不需要分词就用keyword。不需要搜索的字段就加 “index”:false 。

然后还有定义了一个all。它是一个分词的text，它是由前面字段里面所有带 copy to all的字段组合而成的。意味着之后我搜索的时候可以这几个字段一起搜。

初始化javaRestCliet

引入依赖：

    <properties>
        <java.version>1.8</java.version>
        <elasticsearch.version>7.12.1</elasticsearch.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.12.1</version>
        </dependency>

写一个简单的单元测试：


public class HotelIndexTest {

    private RestHighLevelClient client;

    @BeforeEach
    void setUp(){
        this.client = new RestHighLevelClient(RestClient.builder(
                HttpHost.create("http://192.168.88.151:9200")
        ));
    }

    @AfterEach
    void tearDown() throws IOException {
        this.client.close();
    }

    @Test
    void testInit(){
        System.out.println(client);
    }
}