目录
评分机制
机制
查看评分实现如何算出来的explain=true
分析能否被搜索到
Doc value 正排序索引
Query phase
Fetch phase
Preference 问题 解决跳跃结果问题
Timeout 到达时间直接返回,解决耗时过长问题
Routing 数据准确分配到某地,解决相同属性值都到一个地方
评分机制
机制
- TF分词频率 关键词在 文档中出现次数 越高 分越高
- IDF 各个词条出现越多越不相关 因为有很多重复的,但是出现越少 但 出现匹配的关键词多二少 则 分高
- 字段长度越长分越弱 出现的少则比例高
查看评分实现如何算出来的explain=true
分析能否被搜索到
Doc value 正排序索引
和数据库一样 为解决排序使用
Query phase
深度分页 各个节点前1万条数据 把id和 匹配分数 给到协调节点
Fetch phase
数据汇总分析 协调节点分析后取值返回
Preference 问题 解决跳跃结果问题
因为插入数据同步主分批和副本分片的数据不同导致跳跃结果
如何解决:
先从主分片上拿 或只从某个分片上取值,就可以避免跳跃结果问题
Timeout 到达时间直接返回,解决耗时过长问题
Get /_search?timeout=10ms
Routing 数据准确分配到某地,解决相同属性值都到一个地方
Get /_search?routing=user123
ok
持续更新