elasticsearch8.12 分词器安装

news2025/4/16 7:10:52

分词器的主要作用将用户输入的一段文本，按照一定逻辑，分析成多个词语的一种工具

分词器下载地址

analysis-ik

Releases · infinilabs/analysis-ik · GitHub

一个简便安装方式安装完成之后会提示重启，重启es即可

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.12.2/elasticsearch-analysis-ik-8.12.2.zip

安装完成测试

curl -X GET -H "Content-Type: application/json"  "http://localhost:9200/_analyze?pretty=true" -d'{"text":"我就是全村人的希望","analyzer": "ik_smart"}'

8.12 版本会执行错误因为启用了https，使用postman 在授权中配置账户密码

返回如下结果证明安装成功

什么时候分词

创建索引：当索引文档字符类型为text时，在建立索引时将会对该字段进行分词。
搜索：当对一个text类型的字段进行全文检索时，会对用户输入的文本进行分词。

分词添加时机：

添加完所以之后，创建mapping的时候

ik_smart	ik分词器中的简单分词器，支持自定义字典，远程字典	学如逆水行舟，不进则退	[学如逆水行舟,不进则退]
ik_max_word	ik_分词器的全量分词器，支持自定义字典，远程字典	学如逆水行舟，不进则退	[学如逆水行舟,学如逆水,逆水行舟,逆水,行舟,不进则退,不进,则,退]

从数据库导入数据到es:

1.安装logstach,es

2.导入mysql drver 到 /usr/share/logstash/logstash-core/lib/jars/

/usr/share/logstash/logstash-core/lib/jars/mysql-connector-java-8.0.16.jar

3. 编写配导入配置文件

需要添加配置cacert.证书指定为 /etc/elasticsearch/certs/http_ca.crt ，如果没有证书需要使用证书生成工具生成下，在此之间试了很多次

input {
  jdbc {
    jdbc_driver_library => "/usr/share/logstash/logstash-core/lib/jars/mysql-connector-java-8.0.16.jar"
    jdbc_driver_class => "com.mysql.cj.jdbc.Driver"
    jdbc_connection_string => "jdbc:mysql://localhost:3306/es_test"
    jdbc_user => "root"
    jdbc_password => "root"
    statement => "SELECT * FROM mytable"
  }
}

output {
  elasticsearch {
    hosts => ["https://localhost:9200"]
    index => "myindex"
    document_id => "%{id}"
    user => "elastic"
    password => "BzevJY1OL-kEBnw*ZJBu"
    cacert => '/etc/elasticsearch/certs/http_ca.crt'
  }
}

4. 执行导入命令

/usr/share/logstash/bin/logstash -f /usr/share/logstash/conf/mysql.conf

如下:看到successfully

回到kibana 后台看到变为47 则说明导入成功。有时候看到successfully 并不代表成功，需要看具体的导入数据才行

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1518092.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

elasticsearch8.12 分词器安装

什么时候分词

相关文章

19C 19.22 RAC 2节点一键安装演示

Excel小技巧（3） - 如何取整

每日一题 2312卖木头快

AJAX 05 axios拦截器、数据管理平台

网络架构层_服务器上下行宽带

mysql 主从延迟分析

提前十分钟！有方法论的人和没有方法论的人，谁更从容？弱者不应被错误引导——早读（逆天打工人爬取热门微信文章解读）

并发编程之创建线程的几种方式以及运行的详细解析

04- 基于SpringAMQP封装RabbitMQ,消息队列的Work模型和发布订阅模型

go语言基础笔记

某赛通电子文档安全管理系统 DecryptApplication 任意文件读取漏洞（2024年3月发布）

案例分析篇06：数据库设计相关28个考点（17~22）（2024年软考高级系统架构设计师冲刺知识点总结系列文章）

Jmeter入参问题小记

Leet code 三步问题

.NET高级面试指南专题十八【外观模式模式介绍，提供了简化的接口，隐藏系统的复杂性】

C++面试问题收集

【论文阅读】MoCoGAN: Decomposing Motion and Content for Video Generation

【Java基础】IO流（二）字符集知识

最详细数据仓库项目实现：从0到1的电商数仓建设（采集部分）

YOLOv8改进 | 图像去雾 | 特征融合注意网络FFA-Net增强YOLOv8对于模糊图片检测能力（北大和北航联合提出）