建议从这里开始看:Elasticsearch快速入门及使用
Elasticsearch进阶
- 一.Elasticsearch检索方式
- 1.uri + 检索参数(不常用)
- 2.uri + 请求体(常用,也叫Query DSL)
- 二.Query DSL语法举例
- 1.match全文匹配
- 2.match_phrase短语匹配
- 3.multi_match多字段匹配
- 4.bool复合查询
- 5.term查询
- 三.Elasticsearch分析功能
- 1.aggregations聚合(相当于group by和聚合函数)
- 四.Elasticsearch映射
- 1.查看字段的映射(添加数据的时候,es会默认猜测字段的类型并保存)
- 2.创建映射
- 3.添加新的字段映射
- 4.更新映射
- 五.分词
- 1.安装IK分词器
- 2.分词模式
- (1) ik_smart(最少切分拆分)
- (2) ik_max_word(最细粒度拆分)
- 3.自定义拓展词库
一.Elasticsearch检索方式
1.uri + 检索参数(不常用)
//查询kunkun库下的以account_number升序排序的所有数据,默认查询10条,相当于分页
GET /kunkun/_search?q=*&sort=account_number:asc
解释:
_search:查询关键字
q=*:查询所有数据
sort=account_number:asc:以account_number字段为排序条件
2.uri + 请求体(常用,也叫Query DSL)
GET /kunkun/_search
{
"query": { //匹配所有
"match_all": {}
},
"sort": [
{
"account_number": "asc" //升序排序
},
{
"age": "desc" //降序排序
}
],
"from": 10,//从第十条开始
"size": 10 //查十条
"_source":["account_number","age"] //查出的数据只有account_number和age字段
}
二.Query DSL语法举例
Query DSL官网文档
1.match全文匹配
//全文检索按照相关性得分进行排序
GET /kunkun/_search
{
"query": {
"match": { //匹配条件 address包含'Court'或'ikun'的数据
"address": "Court ikun"
}
}
}
2.match_phrase短语匹配
GET /kunkun/_search
{
"query": {
"match_phrase": { //短语匹配 address包含'Court ikun'的数据
"address": "Court ikun"
}
}
}
3.multi_match多字段匹配
GET /kunkun/_search
{
"query": {
"multi_match": {
"query": "Court", //匹配条件 匹配'address'和'email'字段包含'Court'的数据
"fields": ["address","email"] //匹配字段
}
}
}
4.bool复合查询
GET /kunkun/_search
{
"query": {
"bool": {
"must": [ //lastname必须是ikun(满足的话,相关性得分会更高)
{ "match": { "lastname": "ikun" } }
],
"must_not": [//email必须不是xiaoheizi(满足的话,相关性得分会更高)
{ "match": { "email": "xiaoheizi" } }
],
"should":[//年龄是不是25都可以(满足的话,相关性得分会更高)
{"match": {
"age": "25"
}}
],
"filter": { //过滤年龄在10-30之间的结果(满足也不计算相关性得分)
"range": {
"age": {
"gte": 10,
"lte": 30
}
}
}
}
}
}
5.term查询
注意: term用于查询非文本字段
//匹配age是22的数据
GET /kunkun/_search
{
"query": {
"term": {
"age": "22"
}
}
}
三.Elasticsearch分析功能
1.aggregations聚合(相当于group by和聚合函数)
aggregations聚合官网文档
/**
* (1) 查询address包含mill的所有人的年龄分布及平均年龄
*/
GET /kunkun/_search
{
"query": {
"match": {
"address": "mill"
}
},
"aggs": {//聚合
"ikunAgg": {//聚合操作名称可以自定义
"terms": {//查看age的分布
"field": "age",
"size": 10 //取出age前10种分布
}
},
"ikunAvg":{//自定义平均年龄的名称
"avg": { //求age的平均值
"field": "age"
}
}
}
}
/**
* (2) 按照年龄聚合,并且查出这些年龄段人的平均薪资
*/
GET /kunkun/_search
{
"query": {
"match_all": {//查询全部内容
}
},
"aggs": {
"ikunAgg": {//聚合年龄
"terms": {
"field": "age"
},
"aggs": {//在年龄聚合下,嵌套工资的子聚合
"ikunAvg": {
"avg": {
"field": "balance"
}
}
}
}
}
}
四.Elasticsearch映射
mapping映射官网文档
Mapping是用来定义一个文档,以及它包含的属性是如何储存和索引的(就是给字段指定类型)。
1.查看字段的映射(添加数据的时候,es会默认猜测字段的类型并保存)
//查看字段的类型
GET /kunkun/_mapping
2.创建映射
PUT /my-index
{
"mappings": {
"properties": {
"age": { "type": "integer" },
//keyword:是精准匹配。
"email": { "type": "keyword" },
//text:保存的时候会进行分词,然后检索的时候按照分词进行匹配。
"name": { "type": "text" }
}
}
}
3.添加新的字段映射
PUT /my-index/_mapping
{
"properties":{
"chang":{ //新加字段名字
"type":"text", //映射类型
"index":"false" //该字段不参与检索
}
}
}
4.更新映射
对于已存在的字段映射我们不能直接去更新,我们需要创建新的索引进行数据迁移。
//1.创建新的索引并更新字段映射
PUT /my-index—new
{
"mappings": {
"properties": {
"age": { "type": "long" },
"email": { "type": "text" },
"name": { "type": "text" }
}
}
}
//2.把旧索引数据迁移到新索引
POST _reindex
{
"source": {
"index": "my-index", //旧索引名称
"type": "account" //旧索引的类型(6.0版本之前,6.0之后版本不需要写类型)
},
"dest": {
"index": "my-index—new" //新索引的名称
}
}
五.分词
es内置的分词器文档
IK分词器7.3.1 提取码:0221
IK其他版本
一个 tokenizer (分词器) 接收一个字符流,将之分割为独立的 tokens (词元,通常是独立的单词),然后输出 tokens 流。
//默认是standard分词器
POST _analyze
{
"analyzer": "standard", //分词器类型
"text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone." //分词的语句
}
注意:因为es内嵌的分词器都是对英文的分词,所以我们还要下载中文的分词器(IK分词器插件的版本要和ElasticSearch的版本一致)。
1.安装IK分词器
把你下载下来的分词器放在 elasticsearch目录下 -> plugins
2.分词模式
(1) ik_smart(最少切分拆分)
POST _analyze
{
"analyzer": "ik_smart",
"text": "我是小黑子"
}
(2) ik_max_word(最细粒度拆分)
3.自定义拓展词库
说明: 因为有一些词,识别不了。比如:我是真爱坤和一些网络用语分词就不准确,所以咱们要自定义拓展词库。
(1) 没自定义拓展词库之前
(2) 自定义词库
(3) 加了自定义词库之后