docker安装EelasticSearch、目录权限修改、并安装IK 中文分词器

news2025/1/23 4:50:14

文章目录

  • docker安装EelasticSearch、目录权限修改、并安装IK 中文分词器
    • 1、docker安装ES
    • 2、docker ps发现容器没有正常启动,docker logs 容器id 查看日志发现是挂载目录的权限不足
    • 3、修改目录的权限
    • 4、使用docker restart 容器id重新启动刚才没有启动成功的容器
    • 5、在浏览器下载es客户端插件
    • 6、ik_smart和 ik_max_word中文分词器的安装
      • 6.1、为什么要安装分词器?
      • ik_smart
      • ik_max_word
      • 6.3、ik的安装
      • 6.4、使用客户端查看

docker安装EelasticSearch、目录权限修改、并安装IK 中文分词器

1、docker安装ES

在你的linux系统的opt目录下创建一个es7文件夹,里面再创建一个data文件夹

docker run -d --name es7 -e ES_JAVA_POTS="-Xms256m -Xmx256m" -e "discovery.type=single-node" -v /opt/es7/data/:/usr/share/elasticsearch/data  -p 9200:9200 -p 9300:9300 elasticsearch:7.14.0

2、docker ps发现容器没有正常启动,docker logs 容器id 查看日志发现是挂载目录的权限不足

在这里插入图片描述

3、修改目录的权限

进入刚才建立的es7目录,修改权限

cd /opt/es7/
chmod 777 ./data

在这里插入图片描述

4、使用docker restart 容器id重新启动刚才没有启动成功的容器

5、在浏览器下载es客户端插件

在这里插入图片描述

6、ik_smart和 ik_max_word中文分词器的安装

6.1、为什么要安装分词器?

ik_smartik_max_word 是 Elasticsearch 中 IK 分词器(IK Analyzer)的两种分词模式。IK 分词器是一款针对中文文本处理的插件,旨在提高中文文本在Elasticsearch中的索引和搜索效率。以下是这两种分词模式的详细解释:

ik_smart

ik_smart 模式,也称为“智能分词”模式,其特点是:

  1. 简明高效:该模式倾向于生成较少的词语切分结果,倾向于输出最具代表性和语义关联性强的词汇组合。它会尽可能减少冗余和无意义的词语片段,生成的分词结果相对精简。

  2. 歧义处理:ik_smart 在处理多义词、同音字、形似字等可能导致歧义的情况时,会依据上下文信息和语言模型进行判断,选择最符合语境的分词结果。

  3. 适用场景:由于生成的分词结果较为简洁且具有较高的语义相关性,ik_smart 模式通常适用于对查询效率要求较高或者希望减少无关结果干扰的场景。例如,在搜索引擎中进行精确匹配查询、短语查询或是在高精度推荐系统中进行关键词分析时,使用 ik_smart 可能会得到更精准的匹配效果。

ik_max_word

ik_max_word 模式,也称为“最大词数”或“细粒度分词”模式,其特点包括:

  1. 全面覆盖:该模式致力于生成最多的词语切分结果,力求穷尽文本中所有可能的词语组合,包括单个汉字、词组、成语以及专有名词等。因此,ik_max_word 分词结果通常包含大量的短词和长词组合。

  2. 无歧义处理:相较于 ik_smart,ik_max_word 模式在处理歧义时通常不做过多的语义判断,而是尽可能多地保留原始文本的所有可能切分结果。这意味着可能会包含一些在特定语境下并非最佳的分词选项。

  3. 适用场景:ik_max_word 模式适用于需要进行广泛匹配查询、全文检索、语料库建设、词语统计分析等对词汇覆盖率要求较高的场景。在这种情况下,全面且详细的分词结果有助于确保不会遗漏任何潜在的相关信息,尽管这可能会引入一些噪音(即无关或冗余的词语)。

总结来说,ik_smartik_max_word 主要区别在于分词结果的数量和精细化程度:

  • ik_smart 侧重于生成精炼、语义相关的词汇组合,适用于对查询效率和精确度要求较高的场景。
  • ik_max_word 则强调全面覆盖,尽可能输出所有可能的词语切分结果,适用于需要广泛匹配或进行详细词汇分析的场景。

实际应用中,选择哪种分词模式应根据具体的业务需求和应用场景来决定。

6.3、ik的安装

https://github.com/medcl/elasticsearch-analysis-ik/releases

#第一步 copy 插件到容器
docker cp /opt/es7/elasticsearch-analysis-ik-7.14.0.zip 容器id:/usr/share/elasticsearch

#第二步进入你的容器
docker exec -it 容器id /bin/bash

#第三步执行如下命令,安装插件,中间会提示 Y or N,直接写 Y ,回车即可
elasticsearch-plugin install file:\/usr/share/elasticsearch/elasticsearch-analysis-ik-7.14.0.zip

#第四步退出容器
exit

#第五步重启容器
docker restart 容器ID

6.4、使用客户端查看

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1602426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能揭示矩阵乘法的新可能性

人工智能揭示矩阵乘法的新可能性 数学家酷爱漂亮的谜题。当你尝试找到最有效的方法时,即使像乘法矩阵(二维数字表)这样抽象的东西也会感觉像玩一场游戏。这有点像尝试用尽可能少的步骤解开魔方——具有挑战性,但也很诱人。除了魔方…

嵌入式工程师如何摸鱼?

有老铁问我,做嵌入式开发要加班吗? 也不知道搞什么鬼,现在的年轻人对加班这么抵触。 我刚做开发那会,啥也不懂,每天基本都要加班到晚上7-9点不等,我并不抵触加班,因为早早回家,也没什…

【文献分享】PCCP:机器学习 + 分子动力学 + 第一性原理 + 热学性质 + 微观结构

分享一篇关于机器学习 分子动力学 第一性原理 热学性质(密度、粘度、扩散系数) 微观结构的文章。 感谢论文的原作者! 关键词: 1. Machine learning, 2. Deep potential, 3. Molecular dynamics 4. Molten salt, 5. Thermo…

10-菜刀连接木马

找到了漏洞后,并且上传了木马之后才能使用的两款工具 中国菜刀和冰蝎 想办法获取别人的cookie,cookie中有session-id 一、中国菜刀 1、必须提前已经完成木马植入然后才能使用 2、木马必须是POST请求,参数自定义,在菜刀里给出…

苹果系统如何使用CorelDRAW?coreldraw苹果版使用指南

有不少粉丝使用的是苹果的电脑或者笔记本,想要利用最新的M系列芯片带来的长续航便利,实现外出时进行创意设计的工作。 那如何才能在苹果系统使用CorelDRAW?2个方法分享给大家: 一、购买Mac版CorelDRAW 从2020版开始&#xff0c…

预分region解决热点问题(面试题)

一、题目:如何解决hbase中遇到的热点问题? 1、问题引入 在默认的拆分策略中 ,region的大小达到一定的阈值以后才会进行拆分,并且拆分的region在同一个regionserver中 ,只有达到负载均衡的时机时才会进行region重分配!并且开始如果有大量的数据进行插入操…

【HormonyOS4+NEXT】TypeScript基础语法详解

🙋‍ 一日之际在于晨 ⭐本期内容:TypeScript基础语法详解 🏆系列专栏:鸿蒙HarmonyOS4NEXT:探索未来智能生态新纪元 文章目录 前言变量与类型函数类与接口类(Class)接口(Interface&am…

基于51单片机点滴输液控制系统LCD显示( proteus仿真+程序+设计报告+讲解视频)

基于51单片机点滴输液控制系统LCD显示 1. 主要功能:2. 讲解视频:3. 仿真设计4. 程序代码5. 设计报告6. 设计资料内容清单&&下载链接 基于51单片机点滴输液控制系统LCD显示( proteus仿真程序设计报告讲解视频) 仿真图proteus7.8及以上…

Ubuntu上安装Chrome浏览器

安装步骤 1.下载安装chrome安装包 wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb2.安装Chrome浏览器 sudo dpkg -i google-chrome-stable_current_amd64.debsudo apt-get -f install3.启动Chrome浏览器 查看收藏夹里的Chrome图标 单击C…

【已开源】​基于stm32f103的爬墙小车

​基于stm32f103的遥控器无线控制爬墙小车,实现功能为可平衡在竖直墙面上,并进行移动和转向,具有超声波防撞功能。 直接上: 演示视频如:哔哩哔哩】 https://b23.tv/BzVTymO 项目说明: 在这个项目中&…

前端开发攻略---从源码角度分析Vue3的Propy比Vue2的defineproperty到底好在哪里。一篇文章让你彻底弄懂响应式原理。

1、思考 Vue的响应式到底要干什么? 无非就是要知道当你读取对象的时候,要知道它读了。要做一些别的事情无非就是要知道当你修改对象的时候,要知道它改了。要做一些别的事情所以要想一个办法,把读取和修改的动作变成一个函数&#…

ESXi 无法启动NTP守护进程

在VMware ESXi环境中如果遇到无法启动NTP(Network Time Protocol)守护进程的问题,可以通过以下步骤进行排查和解决: 步骤1:检查与修复配置文件 登录到ESXi Shell(SSH)。编辑 /etc/ntp.conf 配…

北京InfoComm展推出500款新品,覆盖30个市场,助力行业未来

【2024年4月17日——北京讯】亚太区首屈一指的专业视听和集成体验解决方案展北京InfoComm China 2024 今天在北京的国家会议中心 (CNCC) 盛大开幕,展开为期三天的商贸展会和高峰会议。作为行业产品发布的首要平台,北京InfoComm China吸引众多展商携新品推…

使用vite从头搭建一个vue3项目(二)创建目录文件夹以及添加vue-router

目录 一、创建 vue3 项目 vite-vue3-project-js二、创建项目目录三、创建Home、About组件以及 vue-router 配置路由四、修改完成后页面 一、创建 vue3 项目 vite-vue3-project-js 使用 vite 创建一个极简 vue3 项目请参考此文章:使用vite从头搭建一个vue3项目&…

Android 使用ping命令判断当前网络状态

一. 介绍 ping命令是用来测试和诊断网络连接问题的基本命令,当然我们的终端设备(手机/平板/车机)都可以用这个命令来判断当前网络是否有流量的状态,本篇文章主要介绍Linux的ping命令,因为Android系统也是使用了Linux内…

Latex学习(从入门到入土)2

第一章 :插图 在LaTeX中插入插图可以通过graphicx宏包来实现,这个宏包提供了强大的图像处理功能。以下是如何使用graphicx宏包插入图像的基本步骤: ### 1. 加载宏包 在文档的序言部分(\begin{document}之前)&#x…

char和varchar的区别?

一、问题解析 char和varchar都是用于在数据库中存储字符串的数据类型。它们之间的主要区别在于存储空间的使用方式: char是一种定长的数据类型,它的长度固定且在存储时会自动在结尾添加空格来将字符串填满指定的长度。char的长度范围是0-255&#xff0c…

Redis之路系列(3)纸上得来终觉浅(下)

03 纸上得来终觉浅(下) 基于Redis6,本章节主要介绍了Rdis的一些主要应用场景,包含了:大数据的过滤,分布式锁设计,并讲解了有趣的布隆过滤器原理,HyperLogLog 原理,二进制位数与存储大小计算的常…

MinlO以及阿里云OSS对象存储服务

MinlO MinIO是一个开源的对象存储系统,专为云原生和容器化环境而设计。它使用分布式架构来存储和管理大规模的非结构化数据,例如图片、视频、日志文件等。MinIO基于Amazon S3协议,并提供了与S3兼容的API,这使得它能够与现有的S3生…

2.6 类型安全配置属性

无论是Propertes配置还是YAML配置,最终都会被加载到Spring Environment中。 Spring提供了注解Value以及EnvironmentAware接口来将Spring Environment 中的数据注入到属性上,SpringBoot对此进一步提出了类型安全配置属性(Type-safeConfiguration Propert…