Elasticsearch 8.X 分词插件版本更新不及时解决方案

news2024/10/6 13:21:11

1、关于 Elasticsearch 8.X IK 分词插件相关问题

球友在 ElasticSearch 版本选型问题中提及:如果要使用ik插件,是不是就使用目前最新的IK对应elasticsearch的版本“8.8.2”?

https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2

如果要使用最新es版本,而IK没有对应的,老师有推荐的其他类似插件吗?谢谢!——问题来源:https://t.zsxq.com/13YX8fFQy

bb762d980d7915f5d5c143ba9cf90919.png

2、  说一下  Elasticsearch 中文分词插件

  • IK Analyzer

描述:基于词典的中文分词插件。

资源链接:https://github.com/medcl/elasticsearch-analysis-ik

目前业界使用相对广泛,尤其中小型企业。

  • HanLP

描述:基于NLP技术,提供了一系列中文处理能力的分词插件。

资源链接:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
  • Jieba

描述:结巴分词的Elasticsearch插件版本。

资源链接:https://github.com/sing1ee/elasticsearch-jieba-plugin
  • Ansj

描述:速度快,能够识别新词的中文分词插件。

资源链接:https://github.com/NLPchina/elasticsearch-analysis-ansj
  • SmartCN

描述:Elasticsearch自带的基于Lucene的中文分词插件。

资源链接:Elasticsearch官方文档
  • MMSEG

描述:基于词典的复杂切分算法中文分词插件。5.X版本后未再更新

资源链接:https://github.com/medcl/elasticsearch-analysis-mmseg

根据具体的应用场景和需求,可以选择合适的中文分词插件。

另外,需要注意的是,当使用插件时要确保其版本与Elasticsearch版本相匹配,以避免可能出现的兼容性问题。

3、IK 分词插件如何使用最新版本?

开篇提及问题本质:Elasticsearch 更新版本快, 而 IK 更新较慢的问题。举例:如下图所示,当前是 2023年10月20日,Elasticsearch 最新版本为:8.10.4,而 IK 插件的版本为:8.9.0。

149c1952d19d30dd8222dedcd8e7e73f.png

44e72251c5c237fa539a6858e2aeaed0.png

两者类型不匹配,安装的时候会报错。

怎么办?这其实就是开篇问题所在。

咱们可以分析一下 IK 插件的代码,插件源码近1年+几乎没有任何更新。

也就是说:是不是只手动改一下配置文件,自己手动下载部署可不可以呢?

其实是可以的,咱们归拢一下步骤。

步骤1:下载当前最新的 IK 插件。

1c2140d1728a4d814fd35a5efe5c61be.png

步骤2:解压源码

这里的外层文件名是我手动由 8.9.0 改成 8.10.2 的,我的虚拟机集群是 8.10.2 版本。

36aaa913b4cb4a5a4e0a4aebf7a58650.png

修改配置:

36a1c166db9777604692129feff88d98.png

如上内容由原来的版本号 8.9.0,改成 8.10.2 就可以了!

完成后新版本打包,如下所示,打包为:elasticsearch-analysis-ik-8.10.2.zip文件。

ac37a2bb9767871c6dbbd83ecdae2482.png

步骤3:安装 Elasticsearch IK插件。

如下图所示,参考IK的文档,我们采取方式1。

8ecfd79816ff4b494e927710e4be162d.png

第一步:解压elasticsearch-analysis-ik-8.10.2.zip到如下的 plugins 下的 ik 文件夹下。

c0dc5f062bc16d7e1f8f017558126d51.png

ik 文件需要我们提前手动创建。

解压后效果:

第二步:重启 Elasticsearch。

088b0aed86bbda9d9a43920d3a301474.png

步骤4:验证 IK 插件是否成功。

这个创建个索引,指定映射中的某个字段为 ik_max_word 或者  ik_smart 就可以了。

PUT test_index_001
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

4、小结

改动非常小,只为版本适配问题。更多类似问题,欢迎留言交流。

  • 推荐阅读

  • 全网首发!从 0 到 1 Elasticsearch 8.X 通关视频

  • 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单

  • 如何系统的学习 Elasticsearch ?

  • 那些 ChatGPT4 也搞不定的 Elasticsearch 问题,请抛给我们!

84443e0da272f73c85c0dd71c98efc07.jpeg

更短时间更快习得更多干货!

中国50%+Elastic认证专家出自于此!

d8564eabb8553df345608531e9b1355c.gif

比同事抢先一步学习进阶干货!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1116346.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++入门3+类和对象上

C入门3类和对象上 一.内联函数1.宏函数的缺点2.宏函数的优点3.内联函数的语法4.内联函数的优缺点5.内联函数的使用条件6.内联函数的展开7.内联函数的一大注意事项1.内联函数声明跟定义分离2.内联函数声明跟定义分离的"奇怪"现象 二.C11对于C语法的补充1.auto关键字1.…

【Nginx34】Nginx学习:安全链接、范围分片以及请求分流模块

Nginx学习:安全链接、范围分片以及请求分流模块 又迎来新的模块了,今天的内容不多,但我们都进行了详细的测试,所以可能看起来会多一点哦。这三个模块之前也从来都没用过,但是通过学习之后发现,貌似还都挺有…

python模块之feapder 爬虫框架

一、简介 官网:https://feapder.com/#/ feapder是一款上手简单,功能强大的Python爬虫框架,内置AirSpider、Spider、TaskSpider、BatchSpider四种爬虫解决不同场景的需求,但像任何工具一样,它也有其优点和缺点。以下是…

如何利用考培系统进行个性化学习和评估

考培系统作为一种现代化的学习和评估工具,可以为学生提供个性化的学习和评估服务。它利用先进的技术和算法,根据学生的学习情况和需求,为其量身定制学习计划,并提供相应的评估反馈。 1. 个性化学习 考培系统通过分析学生的学习情…

QML(25)——文本输入框组件的区别(TextField TextInput TextArea TextEdit)

目录 效果展示适用场景文本组件TextLabelText和Label的区别 单行文本输入框TextFieldTextInputTextField 和 TextInput的区别 多行文本输入框TextAreaTextArea 和 TextEdit 的区别 效果展示 适用场景 场景组件属性短文本Text长文本 末尾省略Textelide: Text.ElideRight文本设置…

通用FIFO设计深度8宽度64,verilog仿真,源码和视频

名称:通用FIFO设计深度8宽度64,verilog仿真 软件:Quartus 语言:verilog 本代码为FIFO通用代码,其他深度和位宽可简单修改以下参数得到 reg [63:0] ram [7:0];//RAM。深度8,宽度64 代码功能&#xff1a…

ArmSoM-RK3588编解码之mpp解码demo解析:mpi_dec_test

1. 简介 [RK3588从入门到精通] 专栏总目录 mpi_dec_test 是rockchip官方解码 demo 本篇文章进行mpi_dec_test 的代码解析,解码流程解析 2. 环境介绍 硬件环境: ArmSoM-W3 RK3588开发板 软件版本: OS:ArmSoM-W3 Debian11 3.…

低代码助力软件开发

低代码开发工具正在日益变得强大,它正不断弥合着前后端开发之间的差距。对于后端来说,基于低代码平台开发应用时,完全不用担心前端的打包、部署等问题,也不用学习各种框架(Vue、React、Angular等等)&#x…

GO 语言如何用好变长参数?

函数重载 对于函数重载相信编码过的 xdm 肯定不会陌生,函数重载就是在同一个作用域内定义多个具有相同名称但参数列表不同的函数 此处的参数列表不同,可以是参数的类型不同,参数的个数不同 那么我们一起分别来看看 C 语言,C 语…

物联网专业前景怎么样?

物联网专业前景怎么样? 物联网专业在当今技术发展迅速的背景下具有广阔的前景。以下是物联网专业的一些优势和就业前景: 1.市场需求大:物联网作为人工智能、云计算和大数据等技术的结合,已经成为许多行业的核心需求。各行各业都需…

【智能指针】

目录: 前言智能指针(一)智能指针初始了解内存泄漏1. 内存泄漏分类2. 如何检测内存泄漏3. 如何避免内存泄漏使用智能指针之前,异常安全的处理 (二)智能指针实现既原理智能指针RAII使用智能指针之后&#xff…

060:mapboxGL点击某处,通过flyTo,以动画的形式聚焦到此点

第060个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+mapbox中点击某处,通过flyto,以动画的形式聚焦到此点。这里用到了flyTo的方法,里面可以设置bearing,zoom,pitch等众多的属性内容。 直接复制下面的 vue+mapbox源代码,操作2分钟即可运行实现效果 文章目录 示…

数据结构与算法-(10)---列表(List)

🌈write in front🌈 🧸大家好,我是Aileen🧸.希望你看完之后,能对你有所帮助,不足请指正!共同学习交流. 🆔本文由Aileen_0v0🧸 原创 CSDN首发🐒 如…

Linux 最大可以打开多少文件描述符?

Linux 最大可以打开多少文件描述符? 在日常开发中,对文件的操作可谓是再寻常不过的意见事情。那么你是否有这样一个疑问, 我最多可以打开多少个文件呢? 在Linux系统中,当某个程序打开文件时,内核返回相应…

SQL查询命令互转vba格式

最近搞个Excel的vba查询数据库,发现vba有代码行长度限制需要转换下就弄了这个,布局和功能暂且这样了,哪位大佬如果有兴趣的可以再美化下! 这次更新了SQL命令互转VBA格式, SQL原始格式要分行的不能一坨贴进去&#xff0…

Java日志系统之JUL

目录 JUL介绍 JUL的使用 日志级别 指定日志输出地址 Logger对象的父子关系 Logger读取配置文件 JUL介绍 Java自带的框架,使用简单,无需引入依赖 JUL的使用 public class JULTest {Testpublic void testLogger() throws Exception{//获取日志记录…

2 用TensorFlow构建一个简单的神经网络

上一篇:1 如何入门TensorFlow-CSDN博客 环境搭建 后续介绍的相关代码都是在pycharm运行,pycharm安装略。 打开pycharm,创建一个新的项目用于tensorflow编码练习,在Terminal输入命令: # 依赖最新版本的pip pip inst…

[AutoSAR系列] 1.2 AutoSar 综述

AutoSAR是一种汽车工业领域的标准化软件架构,旨在简化不同汽车制造商之间的软件开发和交互。该标准于2003年由一系列欧洲汽车制造商成立的AutoSAR联盟制定并发布,目前已经成为全球范围内的标准。下面将对AutoSAR的概念、架构和实现进行综述。 1. 概述 AutoSAR是汽车电子控制…

Qt 读写文件(QFileQTextStreamQDataStream) 详解

一、读写文本文件 (QFile 类) Qt QFile类是一个用于读取和写入文件的类,它提供了对文件的访问、读取和写入等操作。它既可以操作文本文件,也可以操作二进制文件。 QFile类的功能包括: 打开、关闭文件读取文件内容写入文件内容支持文本模式…

如何让ChatGPT生成图片?

目录 一、那么如何解决让ChatGPT具有画图能力的问题呢? 二、那ChatGPT为什么能生成图片呢? 我们都知道ChatGPT只是个纯文本的AI模型,不具备画图能力。它可以生成文本,但如果让他生成图片就会显示如下的声明: 但通过本…