04、全文检索 -- Solr -- 管理 Solr 的 core(使用命令和图形界面创建、删除 core,以及对core 目录下的各文件进行详细介绍)

news2024/9/23 7:25:05

目录

  • 管理 Solr 的 core
    • 创建 Core
      • 方式1:solr 命令创建
        • 演示:使用 solr 命令创建 Core:
        • 演示:命令删除 Core(彻底删除)
      • 方式2:图形界面创建
        • Web控制台创建Core
        • Web控制台删除 Core(未彻底删除)
          • 重新加回刚刚删除的core
    • Core 目录下的文件介绍:
      • 创建的 core 对应的目录下的文件:
      • Core 目录的 conf 子目录下的文件:
        • managed-schema
        • solrconfig.xml
        • protwords.txt
        • stopword.txt
        • synonyms.txt

管理 Solr 的 core

管理 Solr 的 core,类似于管理传统的关系型数据库里面的表。
演示怎么创建core、怎么删除core


学习之前需要先启动 Solr

执行如下命令即可启动Solr:

solr start -p <端口>

如果不指定端口,Solr 默认的端口是8983

直接输入 solr start 启动就可以了;

显示:在8983端口上启动Solr服务器,等待长达30分钟。寻找快乐!

在这里插入图片描述



创建 Core


Solr 使用 Core 保存索引文档,Solr 的 Core 有点类似于 RDBMS 的表。
因此,在正式使用Solr之前,必须先创建Core。


Solr 提供了两种方式来创建 Core:

方式1:使用 solr 命令的 create_core子命令(或用 create子命令也行)创建Core。

Solr所支持的子命令:
create:根据Solr的运行状态选择创建Core或Collection;
        如果Solr以单机方式运行,该命令创建core;
        若Solr以云模式运行,该命令创建Collection。

方式2:通过图形界面创建Core。



方式1:solr 命令创建

演示:使用 solr 命令创建 Core:

solr create_core -c ljhCore -d sample_techproducts_configs

-c: 指定所创建Core的名字。
-d:指定所创建Core以哪个目录为模板。以 E:\install\Solr\solr-8.11.2\server\solr\configsets 目录下的子目录作为配置模板。

演示:

1、先把 security.json 这个配置文件的这个 blockUnknown 属性改为 false ,就是对未知的用户,先不阻塞,可以访问图形管理界面。不然得话,用上面那个命令创建 Core 就会失败。

在这里插入图片描述

如图:重启之后,可以不用登录,就可以访问这个web图形控制平台。

在这里插入图片描述

接下来就输入这个命令来创建core

solr create_core -c ljhCore -d sample_techproducts_configs

可以看到,成功创建一个叫 ljhCore 的 core

在这里插入图片描述


可以看到,创建的 ljhCore 就放在这里
新创建得到的Core保存在: E:\install\Solr\solr-8.11.2\server\solr

在这里插入图片描述

- d: 的解释:

自己的话解释 -d sample_techproducts_configs :

简单来说,我创建这个 ljhCore 这个core,也就是逻辑索引库,也叫反向逻辑库,
在通过这个cord 进行全文检索的时候,需要用到各种 solr 的配置文件,而需要用到的这些配置文件,在 _default 和 sample_techproducts_configs 这两个文件夹里面都存在,区别就是 sample_techproducts_configs 文件夹里面的配置文件比_default 文件夹里面的配置文件更多更完善。
所以在创建 ljhCore 这个core 时,就指定了 -d sample_techproducts_configs 这个文件夹,表示到时候这个core需要用到的配置文件,就去这个文件夹里面获取就可以了。


详细解释:

使用 create core 创建 Core 时,需要使用 -d 选项指定配置文件目录。

正如前面所言,
Solr 使用 Core 保存索引文档,因此在每个 Core 中都需要配置唯一标识、字段类型、字段、停用词等大量与索引库相关的信息,
这些配置信息需要分别提供各种不同的配置文件。所以Solr 允许通过 -d 选项指定到哪个目录去找配置文件。

通俗地说,Solr  每次创建 Core 时都需要大量的配置文件,而 -d 选项就用于指定这些配置模板所在的路径;
如果不指定 -d 选项,Solr 将默认为该选项使用 _defaut 值,
也就是使用 server\solr\confgsets 路径下 _default 目录下的配置文件作为配置模板。
但不推荐将_default 目录下的配置文件作为产品级的 Core 来使用。

在 serversolr\confgsets 路径下还提供了一个 sample_techproducts_confgs 目录,
该目录下的配置文件可作为产品级的 Core 来使用,因此推荐使用该目录作为 Core 配置文件的目录。

在这里插入图片描述



演示:命令删除 Core(彻底删除)

命令格式:

solr delete [-c Core名称] [-p 端口]

使用solr命令的create_core子命令创建Core时或delete子命令删除Core时,没有提供选项指定用户名和密码,因此需要先将前面security.json文件中blockUnknown属性设为false,它表示关闭Solr的用户验证功能。

在这里插入图片描述


演示:

端口如果不指定,那么就会使用默认的8983端口
输入这个命令来删除刚刚创建的 core

solr delete -c ljhCore 

删除 core 成功

在这里插入图片描述

刚刚创建的 ljhCore 对应的文件夹目录也看不到,这是彻底删除

在这里插入图片描述



方式2:图形界面创建


Web控制台创建Core

(1)在server\solr路径下创建一个 ljhcore 目录——该目录就是要创建的 Core 所在的目录。

在这里插入图片描述

(2)将server\solr\configsets\sample_techproducts_configs 目录内 conf 整个目录(配置文件模板)
复制到第一步创建的 ljhcore 目录中。
(注意:通过这种方式创建Core时,它不会自动生成配置文件,所以需要手动把配置文件复制过来)

在这里插入图片描述


(3)在Web控制台填写 Core 的 name 和 directory 后,然后单击“Add Core”按钮创建Core

——通过这种方式创建Core时,无需关闭 blockUnknown 选项。

在这里插入图片描述

如图:创建 core 成功

在这里插入图片描述

如图,再看文件夹目录,多出了这些,表示初始化成功。
在这里插入图片描述

小提示:name 可以随便写,但是实例的目录要对应好

在这里插入图片描述

这个 dataDir 这里,名字也可以自己起,我也可以写成 mydata 之类的。
在这里插入图片描述


如果不在文件夹先创建core的目录和添加配置文件(conf文件夹),直接在控制台创建,是创建失败的,如图:
我直接创建个aaa,没有在 solr-8.11.2\server\solr 路径下先提前创建 core 的目录和添加配置文件,所以创建失败。
失败原因如图:
在这里插入图片描述

再看下文件夹目录:solr 会自动创建一个 aaa 文件夹,但是里面是空的。

在这里插入图片描述



Web控制台删除 Core(未彻底删除)

在Web控制台先选中指定 Core,然后单击该界面上“Unload”按钮即可删除被选中Core。

通过图形界面删除 Core 时,其本质只是卸载。

如图:点击后确认删除

在这里插入图片描述

可以看到 core 被成功删除

在这里插入图片描述

如图:在图形界面删除的core,其实并未彻底删除,一些配置文件还在。
data 文件夹里面是空的。

在这里插入图片描述


Web控制台删除Core 与 命令行界面 删除Core的区别:

用“solr delete”命令删除Core时,它会把整个Core对应的目录都彻底删除;

当通过图形界面删除 Core 时,它只是将该 Core 从 Solr 系统里删除,并未删除该 Core 对应的目录,因此以后还可重新添加回来。



重新加回刚刚删除的core

把 data 文件删除掉

在这里插入图片描述


name 我这里随便写写试试看,但是实例的文件夹目录要对应好

在这里插入图片描述

重新加回这个core 成功

在这里插入图片描述

可以看到这些配置文件都重新加回来了,
删除的时候data文件夹是空的,现在加回来了

在这里插入图片描述



如果 abc 这个core 的名字不好听,要重新改的话,那么就在图形界面把这个core删除,重新加回来的时候改个名字就可以了

在这里插入图片描述



Core 目录下的文件介绍:


创建的 core 对应的目录下的文件:

- conf:该目录存储该Core的配置信息。
- data(可重命名):保存该Core的索引信息
- core.properties:保存了该Core的名称、dataDir 指定了 core 的索引数据的存储目录。
                   还指定了该core的 schema 配置文件和 config 配置文件。

在这里插入图片描述



Core 目录的 conf 子目录下的文件:


在Core目录的conf子目录下可看到如下常见配置文件:
managed-schema
managed-schema(就是以前的schema.xml):定义该Core的整体Schema,

    包括该Core包括哪些Field类型、哪些Field约束、哪些Field、哪些动态Field、哪些Copy Field。
    该文件以前的文件名是schema.xml、用户可通过文本编辑器直接编辑它,
    现在则推荐使用图形界面编辑,这样更安全、有效。

在这里插入图片描述

solrconfig.xml
solrconfig.xml:该 Core 的索引库相关配置。

在这里插入图片描述


protwords.txt
protwords.txt:配置该 Core 额外的保护词。

   所谓保护词就是停止对该词的 “词干化”,
   在正常词干化的处理方式下,managing、managed、manageable 这些单词最终都会变成 manage。
   如果不希望某个单词被词干化,就将该单词添加到此文件中。
   保存所有的保护词列表。

如图:基本上没有加任何的保护词。

在这里插入图片描述

在这里插入图片描述

stopword.txt
stopword.txt:配置该 Core 额外的停用词,Lucene 不会对停用词创建反向索引库,
   因此程序也不能对停用词执行搜索。
   保存所有的停用词列表。      

停用词:比如这句 “ 好吃的鸡腿 ”,这里的 “的” 字就属于停用词,
因为我们如果进行检索的话,只会去检索“好吃”,“好吃的”,“鸡腿”,并不会单独去检索这个 “的” 字,因为没有意义 。
所以 Lucene 不会对 停用词 创建反向索引库

在这里插入图片描述

如果我在这里添加 “帅气” 这个词作为停用词,那么 lucene 就不会为这个 “帅气” 创建反向索引库,那么我们在进行全文检索的时候,通过“帅气”这个词来查找时,耗费的时间就会比较长。

在这里插入图片描述


synonyms.txt
synonyms.txt:用于配置该Core的所有同义词。
              保存了所有的同义词列表。

在这里插入图片描述

比如: color => colour

color 是美式英语的写法; colour 是英式英语的写法;
但是它们表示的意义都是 “颜色”

当我把 color => colour 添加到 synonyms.txt 这个保存同义词列表的配置文件里面,
那么如果一篇文章里面出现了color 和 colour 这两个词,当我们在查找 color 的时候,这个 colour 也应该被查找出来,反之也是。

把 color => colour 添加到 synonyms.txt,相当于把 color 和 colour 当成同一个词。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1430892.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试学习笔记-测试用例的编写

7中测试分类 按照阶段可划分单元测试、集成测试、系统测试、验收测试。代码可见度划分黑盒测试、灰盒测试、白盒测试 单元测试&#xff1a;针对源代码的测试 集成测试&#xff1a;针对接口进行测试 系统测试&#xff1a;针对功能和非功能的测试 验收测试&#xff1a;公测、内测…

js中执行上下文和执行栈是什么

文章目录 一、执行上下文二、生命周期创建阶段This Binding词法环境变量环境 执行阶段回收阶段 二、执行栈参考文献 一、执行上下文 简单的来说&#xff0c;执行上下文是一种对Javascript代码执行环境的抽象概念&#xff0c;也就是说只要有Javascript代码运行&#xff0c;那么…

关于Django部署

首先了解一下开发环境服务器跟生产环境服务器有何不同。 一、我们通过 python manage.py runserver 启动开发环境服务器&#xff0c;这条命令背后做了哪些事情&#xff1f; 1、首先加载Django项目的设置&#xff08;settings&#xff09; 2、检查数据库迁移&#xff0c;确保数…

这种学习单片机的顺序是否合理?

这种学习单片机的顺序是否合理&#xff1f; 在开始前我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「单片机的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01…

【Linux Day15 TCP网络通讯】

TCP网络通讯 TCP编程流程 接口介绍 socket()方法是用来创建一个套接字&#xff0c;有了套接字就可以通过网络进行数据的收发。创建套接字时要指定使用的服务类型&#xff0c;使用 TCP 协议选择流式服务&#xff08;SOCK_STREAM&#xff09;。 **bind()方法是用来指定套接字使…

绝地求生:海外博主呼吁PUBG2开发提上日程,PUBG2能否继往日荣光

海外PUBG博主WackyJacky101发推&#xff1a;PUBG 现在的平均玩家人数继续增加&#xff0c;但假期过后这里的势头似乎正在放缓&#xff01;现在是保持势头并宣布制作 PUBG 2 的最佳时机&#xff01; 大家好&#xff0c;我是闲游盒。PUBG作为最早的独立大逃杀游戏之一&#xff0c…

你今年过年回去吗?

#过年 我是一名21岁刚毕业的大学生&#xff0c;专业是软件技术&#xff0c;主修c#&#xff0c;之前在上海实习了一年&#xff0c;正式工作后来到了深圳&#xff0c;进入了一家电商公司实习。至于我为什么转行了&#xff0c;大家懂的都懂 现在是20240203晚上19.39&#xff0c;还…

算法设计与分析实验:回溯

目录 一、组合总和 1.1 具体思路 1.2 思路展示 1.3 代码实现 1.4 复杂度分析 1.5 运行结果 二、全排列 2.1 具体思路 2.2 思路展示 2.3 代码实现 2.4 复杂度分析 2.5 运行结果 三、N皇后问题 3.1 具体思路 3.2 思路展示 3.3 代码实现 3.4 复杂度分析 3.5 运行…

两个重要极限【高数笔记】

【第一个&#xff1a;lim &#xff08;sinx / x&#xff09; 1, x -- > 0】 1.本质&#xff1a; lim &#xff08;sin‘&#xff1f;’ / ‘&#xff1f;’&#xff09; 1, ‘&#xff1f;’ -- > 0&#xff1b;保证‘&#xff1f;’ -- > 0,与趋向无关 2.例题&#x…

Harbor介绍、整体架构和安装

1.Harbor介绍 Harbor 是由 VMware 开源的一款云原生制品仓库&#xff0c;Harbor 的核心功能是存储和管理 Artifact。Harbor 允许用户用命令行工具对容器镜像及其他 Artifact 进行推送和拉取&#xff0c;并提供了图形管理界面帮助用户查看和管理这些 Artifact。在 Harbor 2.0 版…

LangChain 81 LangGraph 从入门到精通三

LangChain系列文章 LangChain 60 深入理解LangChain 表达式语言23 multiple chains链透传参数 LangChain Expression Language (LCEL)LangChain 61 深入理解LangChain 表达式语言24 multiple chains链透传参数 LangChain Expression Language (LCEL)LangChain 62 深入理解Lang…

Logback学习

logback 1、logback介绍 Logback是由log4j创始人设计的另一个开源日志组件&#xff0c;性能比log4j要好。 lockback优点&#xff1a; 内核重写、测试充分、初始化内存加载更小&#xff0c;这一切让logback性能和log4j相比有诸多倍的提升。logback非常自然地直接实现了slf4j…

Open3d计算点云法向量,可视化(代码)

Open3d使用estimate_normals函数来计算法向量。其参数设置Open3d提供了3中参数搜索的方法&#xff08;所有计算的法向量模长为1&#xff09;&#xff1a; open3d.geometry.KDTreeSearchParamKNN(knn20) # 计算近邻的20个点 open3d.geometry.KDTreeSearc…

SVDiff: Compact Parameter Space for Diffusion Fine-Tuning——【论文笔记】

本文发表于ICCV 2023 论文地址&#xff1a;ICCV 2023 Open Access Repository (thecvf.com) 官方代码&#xff1a;mkshing/svdiff-pytorch: Implementation of "SVDiff: Compact Parameter Space for Diffusion Fine-Tuning" (github.com) 一、Introduction 最近几…

Apache POl Excel

目录 介绍 Apache POl的应用场景&#xff1a; 入门使用 通过POI创建Excel文件并且写入文件内容 通过POI读取Excel文件中的内容 介绍 Apache POl是一个处理Miscrosoft Office各种文件格式的开源项目。简单来说就是&#xff0c;我们可以使用POI在Java程序中对Miscrosoft O…

AI应用开发-Visual Studio Code及Remote Development插件远程开发

AI应用开发相关目录 本专栏包括AI应用开发相关内容分享&#xff0c;包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧 适用于具备一定算法及Python使用基础的人群 AI应用开发流程概…

由vscode自动升级导致的“终端可以ssh服务器,但是vscode无法连接服务器”

问题描述 简单来说就是&#xff0c;ssh配置没动&#xff0c;前两天还可以用vscode连接服务器&#xff0c;今天突然就连不上了&#xff0c;但是用本地终端ssh可以顺利连接。 连接情况 我的ssh配置如下&#xff1a; Host gpu3HostName aaaUser zwx现在直接在终端中进行ssh&am…

【数位dp】【动态规划】【KMP】1397. 找到所有好字符串

作者推荐 【动态规划】【字符串】【表达式】2019. 解出数学表达式的学生分数 本文涉及知识点 动态规划汇总 LeetCode1397. 找到所有好字符串 给你两个长度为 n 的字符串 s1 和 s2 &#xff0c;以及一个字符串 evil 。请你返回 好字符串 的数目。 好字符串 的定义为&#x…

从零开始:构建高效的 JMeter 集群压测环境

当面对大量用户模拟和性能测量需求时&#xff0c;单台计算机运行 JMeter 往往显得力不从心。因此&#xff0c;构建一个多节点的JMeter集群成为了一种提升测试性能的有效途径。接下来&#xff0c;本文将详细介绍如何组建和配置一个JMeter测试集群。 一、准备工作&#xff1a;服…

深入理解直接内存和零拷贝

目录 直接内存深入辨析 堆外内存的优点和缺点 零拷贝 什么是零拷贝? Linux的I/O机制与DMA 传统数据传送机制 Linux支持的零拷贝 mmap内存映射 sendfile splice Java生态圈中的零拷贝 NIO提供的内存映射MappedByteBuffer NIO提供的sendfile Kafka中的零拷贝 直接…