之前都是在客户端页面各种操作, 但是我们作为一个java开发者,需要使用代码的方式 来操作ES, 所以我们要先从 Rest Client 开始
准备数据
既然是ES 查数据 不整点测试数据 没法下饭是吧 先建个酒店表 搞点数据:
(新手可能会好奇? 我靠 不是玩ES吗?? 怎么扯到mysql里面来了,不着急 我们先把数据放着 到时候再弄进ES)
Rest Client
我们用redis 有jedis java客户端, 用rabbitmq 也有AMQP ,用mysql有jdbc。 那用ES 肯定也会有个java客户端对吧? 它就是 java rest client。
我们做一部分准备工作 包括idea 框架准备 mybatis依赖 数据库建表 导入数据,Rest Client依赖相关的都准备好。 这些很简单就不赘述了
分析数据结构
首先我们在数据库中的 旅店 表 ddl是这样的:
CREATE TABLE `tb_hotel` (
`id` bigint NOT NULL COMMENT '酒店id',
`name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店名称',
`address` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店地址',
`price` int NOT NULL COMMENT '酒店价格',
`score` int NOT NULL COMMENT '酒店评分',
`brand` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '酒店品牌',
`city` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '所在城市',
`star_name` varchar(16) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店星级,1星到5星,1钻到5钻',
`business` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '商圈',
`latitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '纬度',
`longitude` varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '经度',
`pic` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '酒店图片',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci ROW_FORMAT=COMPACT;
在数据库里面大家都很熟悉, 但是有没想过我们上一篇讲过的ES的数据是怎么存的?建索引库 然后定义mapping, 包括里面有哪些字段 怎么定义 是否加索引 参与搜索, 是否分词,分词器是什么?
这些就是我们把上面mysql的数据导入到ES中的时候需要考虑的:
我们来实践编写一下mapping:
PUT /hotel
{
"mappings":{
"properties":{
"id":{
"type":"keyword"
},
"name":{
"type":"text",
"analyzer":"ik_max_word",
"copy_to": "all"
},
"address":{
"type":"keyword",
"index":false
},
"price":{
"type":"integer"
},
"score":{
"type":"integer"
},
"brand":{
"type":"keyword",
"copy_to": "all"
},
"city":{
"type":"keyword"
},
"starName":{
"type":"keyword"
},
"business":{
"type":"keyword",
"copy_to": "all"
},
"location":{
"type":"geo_point"
},
"pic":{
"type":"keyword",
"index":false
},
"all":{
"type":"text",
"analyzer":"ik_max_word"
}
}
}
}
这个地方要按照上一篇 ES 索引库 mapping的理解来写,比如有的字段需要分词 那么就text+分词器。 不需要分词 就用keyword。 不需要搜索的字段就加 “index”:false 。
然后还有定义了一个all。 它是一个分词的text, 它是由前面字段里面 所有带 copy to all的字段组合而成的。 意味着之后 我搜索的时候 可以这几个字段一起搜。
初始化javaRestCliet
引入依赖:
<properties>
<java.version>1.8</java.version>
<elasticsearch.version>7.12.1</elasticsearch.version>
</properties>
<dependencies>
<dependency>
<groupId>org.elasticsearch.client</groupId>
<artifactId>elasticsearch-rest-high-level-client</artifactId>
<version>7.12.1</version>
</dependency>
写一个简单的单元测试:
public class HotelIndexTest {
private RestHighLevelClient client;
@BeforeEach
void setUp(){
this.client = new RestHighLevelClient(RestClient.builder(
HttpHost.create("http://192.168.88.151:9200")
));
}
@AfterEach
void tearDown() throws IOException {
this.client.close();
}
@Test
void testInit(){
System.out.println(client);
}
}