【Elasticsearch入门到落地】4、Elasticsearch的安装

news2024/12/16 17:37:52

接上篇《3、es与mysql的概念对比》
上一篇我们学习了Elasticsearch与Mysql的概念与区别。本篇我们来进行Elasticsearch的环境准备及软件安装。


一、环境准备

如果我们没有自己的Linux服务器,且现在正在使用的是Windows操作系统的电脑,那么首先我们需要安装VMware Workstation,并在VMware中安装Centos版本的Linux虚拟机做测试用,安装教程如下:
《虚拟机 VMware Workstation-安装详细步骤(作者Envyᥫᩣᩚ)》
https://blog.csdn.net/2302_82029124/article/details/140334173
《linux笔记 - 安装虚拟机(作者zf xia)》
https://blog.csdn.net/qq_43021651/article/details/143341068

这里虚拟机我安装的是VMware Workstation Pro 17,centos镜像使用的是CentOS7.9,Xshell远程连接使用的Xshell8免费版,下载地址如下:
【VMware Workstation Pro 17】下载地址(3DM三大妈):
https://soft.3dmgame.com/down/321412.html
【CentOS7.9】镜像下载地址(阿里云镜像):
https://mirrors.aliyun.com/centos/7.9.2009/isos/x86_64/CentOS-7-x86_64-DVD-2207-02.iso
【Xshell8免费版】官网下载地址:
https://www.xshell.com/zh/free-for-home-school/
装完后效果(记得关闭防火墙,否则有可能xshell连不上):

如果虚拟机连不上外网(例如ping www.baidu.com不通),参考下文
《vmware创建的虚拟机无法连接外网(作者骑士999111)》
https://blog.csdn.net/qishiheyongshi/article/details/133001432

虚拟机和xshell都装好后,我们就可以使用xshell链接虚拟机,IP地址是我们在安装虚拟机的时候设置好的,用root登录就行:

进入根目录查看一下,显示正常即可:

二、安装Docker

在安装Elasticsearch之前,首先需要安装好Docker。什么是Docker?Docker是一个开源的容器化平台,它允许开发者将应用程序及其所有依赖项打包到一个标准化的单元中,这个单元被称为“容器”。容器可以在任何支持Docker的环境中运行,从而确保应用程序的可移植性和一致性。

简单来说,Docker就像一个轻量级的虚拟机,但它比虚拟机更高效,因为它直接使用宿主机的操作系统内核,而不是像虚拟机那样需要模拟一个完整的操作系统。这使得Docker容器的启动速度非常快,并且占用资源更少。
你可以把docker中的一个容器理解为即将安装到VMware中的装好了很多软件环境的ISO镜像文件,只不过这个ISO镜像文件很轻量级。
想了解更多信息大家可到Docker官网查看。安装Docker的教程详见:
《CentOS安装Docker(超详细)(作者屈家全)》
https://blog.csdn.net/weixin_56781779/article/details/132258636

输入“docker -v”查看Docker版本,显示无误后,Docker安装成功:

安装完Docker后,就可以开始安装Elasticsearch了。

有同学会问为啥要先安装docker?原因有如下几点:
在安装Elasticsearch之前先安装Docker,主要基于以下几个原因:

1、安装过程与复杂度

(1)直接安装:
需要手动下载Elasticsearch的二进制包或使用包管理器(如apt、yum等)进行安装。
安装过程可能涉及配置文件的编辑、服务的启动和管理等步骤。
(2)Docker安装:
使用docker pull命令从Docker Hub或其他镜像仓库下载Elasticsearch的Docker镜像。
使用docker run命令启动Elasticsearch容器。
安装过程相对简单,不需要手动配置Elasticsearch的多个细节。

2、资源管理与隔离性

(1)直接安装:
Elasticsearch直接运行在宿主机的操作系统上,直接访问宿主机的资源(如CPU、内存、磁盘等)。
性能直接受宿主机的资源限制,可能会与其他应用程序共享资源,影响性能或安全性。
(2)Docker安装:
Elasticsearch运行在一个隔离的Docker容器中,不会直接访问宿主机的资源。
可以通过Docker命令轻松设置容器的资源限制(如CPU、内存等)。
提供了良好的隔离性,Elasticsearch与其他容器或宿主机上的应用程序是隔离的。

3、升级与维护

(1)直接安装:
升级通常需要停止服务、替换二进制文件、重新配置等步骤。
维护和管理可能需要更多的手动操作。
(2)Docker安装:
升级通常只需要拉取最新的镜像并重新启动容器。
生命周期管理更加简单和自动化。

4、配置与数据持久化

(1)直接安装:
配置文件通常位于宿主机的某个目录中。
数据存储在宿主机上的指定目录中。
需要手动管理配置文件和数据。
(2)Docker安装:
可以使用docker run命令中的-v参数将宿主机上的目录挂载到容器内,以实现配置文件和数据的持久化。
即使容器被删除,配置文件和数据仍然保留在宿主机上。

综上所述,直接安装Elasticsearch和Docker安装Elasticsearch在多个方面存在显著差异。Docker安装提供了更好的资源隔离性、更简单的升级与维护流程以及更灵活的配置与数据持久化选项。而直接安装则可能更直接地利用宿主机的资源,但在资源管理和安全性方面可能需要更多的手动配置。在选择安装方式时,需要根据具体的使用场景和需求进行权衡。

三、安装Elasticsearch

1、需要安装的内容

这里我们部署的是单点的Elasticsearch,而不是集群的,所以安装一台服务即可。
我们要安装的软件除了Elasticsearch,还需要安装Kibana和IK分词器,它们都是数据处理和搜索分析领域的重要工具,各自有不同的功能与作用,区别如下:

(1)Elasticsearch
Elasticsearch是一个基于Lucene构建的开源、分布式、实时的搜索和分析引擎。它主要用于全文搜索、日志分析、实时数据分析等场景,支持多种数据类型(如文本、数字、地理位置等)和灵活的查询语言。Elasticsearch的核心优势包括大规模数据处理能力、高性能搜索、实时分析、灵活性和多样性、易于集成、可扩展性、容错性与高可用性,以及丰富的开源社区支持。

(2)Kibana
Kibana是一个开源的数据可视化和分析平台,设计用于与Elasticsearch协同工作。Kibana允许用户搜索、查看和与存储在Elasticsearch索引中的数据进行交互,可以轻松地执行高级数据分析,并以各种图标、表格和地图的形式可视化数据。Kibana的主要功能包括数据可视化、实时监控、用户友好的界面和与Elastic Stack的无缝集成。通过Kibana,用户可以创建和共享动态仪表板,实时显示Elasticsearch查询的变化,从而更好地理解和分析数据。

(3)IK分词器
IK分词器(IK Analyzer)是一款开源的中文分词工具,支持智能分词、细粒度分词等多种分词模式。它基于词典的分词算法,结合了最大匹配法和逆向最大匹配法,能够在保证分词准确性的同时,保持较高的分词速度。IK分词器的主要作用是将中文文本切分为有意义的词项,为后续的文本分析、信息检索、机器学习等任务提供基础数据。其优势在于高效性、灵活性和多种分词模式,适用于不同的应用场景。

总的来说,Elasticsearch、Kibana和IK分词器在数据处理和搜索分析领域各自扮演着重要的角色。Elasticsearch负责存储、搜索和分析数据;Kibana负责数据的可视化和管理;而IK分词器则专注于中文文本的分词处理,为Elasticsearch等搜索引擎提供准确的分词结果。

2、创建网络

因为我们还需要部署kibana容器,因此需要让es和kibana容器互联。这里先创建一个网络:

docker network create es-net

然后查看网络列表:

docker network ls

效果:

(1)命令含义
docker network create es-net 是一个Docker命令,用于创建一个新的Docker网络。在这个例子中,创建的网络名称是 es-net。Docker网络允许容器之间安全地通信,并且可以通过配置来限制外部访问。
(2)语法解释
docker:这是Docker命令行工具的调用命令,用于执行Docker相关的操作。
network:这是指定要操作的是Docker网络的一个子命令。Docker网络是Docker容器之间通信的基础设施。
create:这是指定要对Docker网络执行的操作,即创建一个新的网络。
es-net:这是新创建的Docker网络的名称。在这个例子中,网络被命名为 es-net,但你可以根据需要将其命名为任何有效的名称。
(3)为什么要创建网络?
在Docker中,容器之间默认是隔离的,它们不能直接相互通信,除非通过特定的网络配置。创建自定义网络(如 es-net)允许你将多个容器连接到一个共同的网络中,使它们能够相互通信。这对于部署需要相互通信的服务(如Elasticsearch和Kibana)非常有用。

Elasticsearch和Kibana容器互联:一旦你创建了 es-net 网络,你就可以在启动Elasticsearch和Kibana容器时将它们连接到这个网络。这可以通过在 docker run 命令中使用 --network 参数来实现。例如:

docker run -d --name elasticsearch --network es-net -p 9200:9200 -p 9300:9300 elasticsearch:latest
docker run -d --name kibana --network es-net -p 5601:5601 kibana:latest

在这个例子中,Elasticsearch和Kibana容器都被连接到了 es-net 网络,因此它们能够相互通信。Kibana将能够访问Elasticsearch提供的API,从而提供数据可视化和搜索功能。
总之,创建Docker网络是部署多个需要相互通信的容器时的一个重要步骤,它提供了容器之间安全通信的基础设施。

3、加载镜像

这里我们采用elasticsearch的7.12.1版本的镜像,这个镜像体积非常大,接近1G,pull下来需要花点时间,获取镜像包语法如下:

docker pull elasticsearch:7.12.1


在过程中可以会遇到报错,解决方案参考下面的文章:
《Error response from daemon: Get “https://registry-1.docker.io/v2/“: net/http: request canceled while(作者修心光)》
https://blog.csdn.net/qq18346342939/article/details/142751367

注:如果pull的时间太长,可以下载CSDN的离线安装包,下载地址:
https://download.csdn.net/download/booguojieji/85329645
使用方法:
elasticsearch的7.12.1版本的镜像,使用docker load -i elasticsearch.tar 加载镜像
kibana的7.12.1版本的镜像,使用docker load -i kibana.tar 加载kibana镜像包
ik分词器,解压到es的plugins目录下

4、运行Elasticsearch

安装好Elasticsearch的镜像后,使用下面的语句将es服务启动起来:

docker run -d \
   --name es \
   -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
   -e "discovery.type=single-node" \
   -v es-data:/usr/share/elasticsearch/data \
   -v es-plugins:/usr/share/elasticsearch/plugins \
   --privileged \
   --network es-net \
  -p 9200:9200 \
  -p 9300:9300 \
elasticsearch:7.12.1

上述语句的解释如下:
(1)docker run -d
docker run 是Docker的命令,用于创建一个新的容器并运行一个命令。
-d 参数表示容器将以“分离模式”运行,即在后台运行。
(2)--name es
--name 参数后面跟的是容器的名称,这里将容器命名为es。
(3)-e "ES_JAVA_OPTS=-Xms512m -Xmx512m"
-e 参数用于设置环境变量。
这里设置的环境变量ES_JAVA_OPTS用于调整Elasticsearch的Java虚拟机(JVM)的启动参数。-Xms512m设置JVM的初始堆大小为512MB,-Xmx512m设置JVM的最大堆大小为512MB。
(4)-e "discovery.type=single-node"
同样使用-e参数设置环境变量。
discovery.type=single-node是Elasticsearch的配置,表示Elasticsearch将以单节点模式运行。这在开发或测试环境中很常见,但在生产环境中通常不推荐,因为缺乏高可用性和数据冗余。
(5)-v es-data:/usr/share/elasticsearch/data
-v 参数用于创建数据卷。
这里创建了一个名为es-data的数据卷,并将其挂载到容器内的/usr/share/elasticsearch/data目录。Elasticsearch的数据将存储在这个数据卷中,这样做的好处是即使容器被删除,数据也不会丢失。
(6)-v es-plugins:/usr/share/elasticsearch/plugins
同样使用-v参数创建数据卷。
这里创建了一个名为es-plugins的数据卷,并将其挂载到容器内的/usr/share/elasticsearch/plugins目录。这允许你将Elasticsearch插件安装在数据卷中,而不是容器内部,同样可以保持插件在容器删除后的持久性。
(7)--privileged
--privileged参数给予容器额外的权限,使得容器内的应用可以访问宿主机的设备,并可以执行一些通常需要较高权限的操作。这对于Elasticsearch这样的应用可能是必要的,因为它可能需要访问宿主机的一些资源。
(8)--network es-net
--network参数用于指定容器要连接的网络。
这里指定容器连接到名为es-net的Docker网络。这允许容器之间的网络通信,适用于需要相互通信的服务。
(9)-p 9200:9200和-p 9300:9300
-p 参数用于端口映射。
这里将容器内的9200、9300端口映射到宿主机的9200、9300端口。9200端口是Elasticsearch的HTTP API端口,用于RESTful通信。9300端口是Elasticsearch的节点间通信端口,用于集群内部通信。
(10)elasticsearch:7.12.1
这是要运行的Docker镜像的名称和标签。
这里使用的是elasticsearch镜像,版本为7.12.1。Docker会从Docker Hub(或其他配置的镜像仓库)下载这个镜像(如果本地没有的话),并基于它启动容器。
综上所述,这个命令启动了一个名为es的Elasticsearch容器,配置了JVM参数、以单节点模式运行、使用数据卷存储数据和插件、拥有较高的权限、连接到特定的Docker网络,并映射了9200和9300端口供外部访问。

启动后效果:

此时我们在浏览器输入http://ip:9200/,就可以看到如下界面(这里的ip是你的Linux虚拟机或服务器的ip):

里面包含了版本信息和服务启动时间,此时说明咱们的elasticsearch已经安装并启动成功。

5、安装Kibana

kibana可以给我们提供一个elasticsearch的可视化界面,便于我们学习。
运行docker命令,部署kibana

docker run -d \
  --name kibana \
  -e ELASTICSEARCH_HOSTS=http://es:9200 \
  --network=es-net \
  -p 5601:5601  \
kibana:7.12.1

●--network es-net :加入一个名为es-net的网络中,与elasticsearch在同一个网络中
●-e ELASTICSEARCH_HOSTS=http://es:9200":设置elasticsearch的地址,因为kibana已经与elasticsearch在一个网络,因此可以用容器名直接访问elasticsearch
●-p 5601:5601:端口映射配置
效果:

kibana启动一般比较慢,需要多等待一会,可以通过命令:

docker logs -f kibana

查看运行日志,当查看到下面的日志,说明成功:

此时,在浏览器输入地址访问:http://ip:5601,即可看到结果(这里的ip是你的Linux虚拟机或服务器的ip):

这里就是Kibana的首页,下面有两种操作模式,一种是“Add Data”导入数据进行试用,一种是“Explore on my own”自己玩。这里我们选择自己玩:

进入“Explore on my own”后,在右上角可以看到“Manage”按钮,是用于管理的,而“Dev tools”即是开发工具。当然我们也可以点击左侧的三个横线,打开主菜单:

这些菜单牵扯到es的各种各样的管理,包括数据分析、外观、安全管理等等。
我们先来用一下Dev tools这个工具:

这是一个DLS(Elasticsearc的查询语句格式)的控制台,它可以让我们非常方便的去发送DLS的请求:

默认在左侧显示的json语句,就是我们的DSL语句。这个语句的含义是“查询所有的数据”。而第一句中的“GET”代表的是我们发送的是一个RESTful风格的HTTP的GET请求,“_search”代表我们要做的是搜索操作。
如果我们点击播放的小按钮,Kibana就会发送左侧的DSL语句给es服务(Kibana之所以知道es服务的地址,是因为在前面我们启动Kibana的时候,已经通过“ELASTICSEARCH_HOSTS”参数指定了es的访问地址)。点击后效果:

可以看到右侧已经有es的反馈结果了,搜到了很多数据信息。
如果我们直接GET一个“/”空路径,那么它输出的结果,就和我们安装好es直接在浏览器上访问的结果一样:

还剩下一个IK分词器没安装,我们在下一篇博文中单独进行讲解。

参考:《黑马Elasticsearch全套教程》

转载请注明出处:https://guangzai.blog.csdn.net/article/details/144490516

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2260624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CRYPTO密码学

加解密算法/编码 哈希算法SM3SHA-3base家族GBGB18030GB2312GBKutf家族恺撒二进制分区法unicodeASCIIDSADSSCRC32校验对称非对称gbk编码h264SEA初探smc动态代码保护四方密码曼彻斯特编码剖析基本概念什么是编码?什么是加密与解密寻找银弹-有没有无法破解的密码通过Java代码入门…

我们来学mysql -- 探讨win安装方式(安装篇)

题记 书接上回,在我们来学mysql – 闲聊(安装篇)中,拿到安装包,当宝贝一样揣在怀里 然而,还没捂热乎,得粉丝秘报,U哥,上篇文章用了滞后的官方文档,哈哈哈…内心的小倔强&#xff0c…

pip 如何快速安装包

一、问题描述 当使用Python通过pip安装一些包时,pip默认是访问的国外的源,但在国内访问又是异常的慢,而且还经常因为网络问题导致安装失败,比如下面通过pip install jupyter来安装jupyter Notebook,这网速真的超级慢&…

CodeBook-Ubuntu-sandbox Linux 沙箱服务 docker pull

CodeBook-Ubuntu-sandbox Linux 沙箱服务 开源技术栏 这是一个多用户的 Linux SSH 服务沙箱,支持启动时动态加载用户列表,并可随时更新用户信息。每个用户仅能修改自己目录下的文件,确保了环境的安全性和隔离性。 目录 文章目录 CodeBook-…

【echarts】数据过多时可以左右滑动查看(可鼠标可滚动条)

1. 鼠标左右拖动 在和 series 同级的地方配置 dataZoom: dataZoom: [{type: inside, // inside 鼠标左右拖图表,滚轮缩放; slider 使用滑动条start: 0, // 左边的滑块位置,表示从 0 开始显示end: 60, // 右边的滑块位置&#xf…

【数据分享】2014-2024年我国POI兴趣点数据(免费获取/来源于OSM地图)

POI是Point of Interest的简称,意为“兴趣点”,是互联网电子地图中用于表示特定位置的地理实体的核心数据类型。POI通常用于标注具体地点,例如餐厅、商场、学校、医院、景点等。这些数据以点的形式呈现,并附带详细属性信息&#x…

使用html和JavaScript实现一个简易的物业管理系统

码实现了一个简易的物业管理系统,主要使用了以下技术和功能: 1.主要技术 使用的技术: HTML: 用于构建网页的基本结构。包括表单、表格、按钮等元素。 CSS: 用于美化网页的外观和布局。设置字体、颜色、边距、对齐方式等样式。 JavaScript…

SSM 垃圾分类系统——高效分类的科技保障

第五章 系统功能实现 5.1管理员登录 管理员登录,通过填写用户名、密码、角色等信息,输入完成后选择登录即可进入垃圾分类系统,如图5-1所示。 图5-1管理员登录界面图 5.2管理员功能实现 5.2.1 用户管理 管理员对用户管理进行填写账号、姓名、…

ip_done

文章目录 路由结论 IP分片 数据链路层重谈Mac地址MAC帧报头局域网的通信原理MSS,以及MAC帧对上层的影响ARP协议 1.公司是不是这样呢? 类似的要给运营商交钱,构建公司的子网,具有公司级别的入口路由器 2.为什么要这样呢?? IP地…

排序算法(5):归并排序

问题 排序 [30, 24, 5, 58, 18, 36, 12, 42, 39] 归并排序 归并排序采用分治法,将序列分成若干子序列,每个子序列有序后再合并成有序的完整序列。 在数组排序中,如果只有一个数,那么它本身就是有序的。如果有两个数&#xff0…

uniapp打包apk教程

文章目录 一、uniapp是什么?二、使用步骤1.需要有Java环境,安装jdk2.安装hbuilderx开发工具3.自签证书4.使用云打包 总结 一、uniapp是什么? ‌uni-app是一个基于Vue.js的跨平台应用开发框架,允许开发者使用一套代码同时构建iOS、…

Titanic - Machine Learning from Disaster————泰坦尼克号幸存者预测————逻辑回归、随机森林和梯度提升树(XGBoost、LightGBM)

目录 1. 引言 2. 理解 Titanic 数据集 目标变量 数据的初步探索 3. 数据预处理 3.1 处理缺失值 3.2 处理类别型特征 3.3 创建新特征 3.4 删除无关特征 3.5 确保所有特征都是数值型 4. 模型选择与训练 4.1 数据集拆分 4.2 选择和训练模型 4.2.1 逻辑回归模型 4.2…

MySQL笔记--多表查询

1--多表关系 多表关系基本上分为三种: 一对多(多对一); 多对多; 一对一; 1-1--多对一 在多的一方建立外键,指向一的一方的主键; 1-2--多对多 建立第三张中间表,中间表至少…

利用git上传项目到GitHub

GitHub是基于git实现的代码托管。git是目前最好用的版本控制系统了,非常受欢迎,比之svn更好。 GitHub可以免费使用,并且快速稳定。 利用GitHub,你可以将项目存档,与其他人分享交流,并让其他开发者帮助你一…

Gate学习(7)引入体素源

一、从GitHub下载体素源模型源码 下载地址:BenAuer2021/Phantoms-for-Nuclear-Medicine-Imaging-Simulation:用于核医学成像应用的模型(闪烁显像、SPECT 和 PET) --- BenAuer2021/Phantoms-For-Nuclear-Medicine-Imaging-Simulat…

快速启动Go-Admin(Gin + Vue3 + Element UI)脚手架管理系统

Go-Admin 是一个基于 Gin Vue Element UI & Arco Design & Ant Design 的前后端分离权限管理系统脚手架。它包含了多租户支持、基础用户管理功能、JWT 鉴权、代码生成器、RBAC 资源控制、表单构建、定时任务等功能。该项目的主要编程语言是 Go 和 JavaScript。 ps&a…

epoll反应堆模型

epoll反应堆模型 基于该视频所做笔记,视频里面讲的也挺难的,最好先让chat给你梳理一遍整体的代码再去看视频吧 15-epoll反应堆模型总述_bilibili_哔哩哔哩_bilibili 文章目录 epoll反应堆模型1.epoll反应堆模型概述2.具体讲解1.myevent_s结构体2.超时检…

F-Cooper论文精读(未完成)

F-Cooper 文章目录 背景有关边缘计算基于单目激光雷达数据的3D目标检测 创新点与以前比创新之处1:引入基于特征的协同感知(F-Cooper)框架创新2:所需数据量减少 2. 基于特征融合的车辆数据处理2.1 卷积特征图2.2 融合特征2.2.1 融…

Z240004基于Java+ssm+maven+mysql的房屋租赁系统的设计与实现

基于ssmmavenmysql的房屋租赁系统的设计与实现 1.项目描述2.运行环境3.项目截图4.源码获取 1.项目描述 该项目在原有的基础上进行了优化,包括新增了注册功能,房屋模糊查询功能,管理员和用户信息管理等功能,以及对网站界面进行了优…

嵌入式软考学习笔记(1)超详细!!!

目录 第一章计算机系统基础知识 1、逻辑运算 2、数的表示 3、总线系统 5、流水线 6、存储器 7、可靠性、校验码 第一章计算机系统基础知识 1、逻辑运算 与:有0则0,全1才1 或:有1则1,全0才0 异或:相同为0…