【Solr】中文分词配置

news2024/11/19 7:31:39

提示:在设置中文分词前需确保已经生成过core,未生成core的可以使用:solr create -c "自定义名称"进行定义。

未分词前的效果预览:
在这里插入图片描述

  1. 下载分词器:
    下载地址: https://mvnrepository.com/artifact/com.github.magese/ik-analyzer/8.3.0
    或者通过maven更新下载

    <dependency>
        <groupId>com.github.magese</groupId>
        <artifactId>ik-analyzer</artifactId>
        <version>8.4.0</version>
    </dependency>
    
  2. 复制jar包
    把下载好的jar包放到以下目录:server\solr-webapp\webapp\WEB-INF\lib在这里插入图片描述

  3. 修改schema
    solr 6.6之前是schema.xml文件,之后则是managed-schema,其位置在 server\solr\新建的core文件夹\conf\文件夹下,比如:server\solr\test001\conf
    添加以下内容:

        <!-- ik分词器 -->
        <fieldType name="text_ik" class="solr.TextField">
            <analyzer type="index">
                <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
                <filter class="solr.LowerCaseFilterFactory"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
                <filter class="solr.LowerCaseFilterFactory"/>
            </analyzer>
        </fieldType>
    
  4. 重启验证
    重启solr服务:solr.cmd restart -p 8983
    或 我是这样操作的:
    在这里插入图片描述
    输入服务地址:http://localhost:8983/,按以下步骤进行验证~
    在这里插入图片描述
    完成~


本文参考自:Solr之基础讲解入门

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/694486.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

山西电力市场日前价格预测【2023-06-29】

日前价格预测 预测明日&#xff08;2023-06-29&#xff09;山西电力市场全天平均日前电价为407.26元/MWh。其中&#xff0c;最高日前价格为539.37元/MWh&#xff0c;预计出现在21: 15。最低日前电价为312.43元/MWh&#xff0c;预计出现在13: 00。以上预测仅供学习参考&#xff…

Java调用ssl异常,javax.net.ssl.SSLHandshakeException: No appropriate protocol

现象&#xff1a;sqlserver 2017 安装在docker里&#xff0c;系统是mac 13&#xff0c;java 1.8.371运行java程序提示上面ssl错误&#xff0c;根据百度提供的方法&#xff0c;修改文件&#xff0c;重启程序搞定。 解决办法&#xff1a;java.security 找到这个文件修改保存 发…

RPC(Remote Procedure Call)学习

目录 一、概念 二、RPC 调用基本流程 一、概念 RPC 全称是 Remote Procedure Call &#xff08;远程过程调用&#xff09;&#xff0c;它是一种通过网络从远程计算机程序上请求服务&#xff0c;可以提供终结点映射程序以及RPC服务&#xff0c;而不需要了解底层网络技术的协议…

三位数字显示电容测试表

广大电子爱好者都有这样的体会&#xff0c;中、高档数字万用表虽有电容测试挡位&#xff0c;但测量范围一般仅为 1pF~20F&#xff0c;往往不能满足使用者的需要&#xff0c;给电容测量带来不便。本电路介绍的三位数显示电容测试表采用四块集成电路&#xff0c;电路简洁、容易制…

element-ui中el-table设置固定高度后,底部合计栏被遮盖

如图: 解决办法:el-table加上ref"summaryTab",然后在自定义合计计算方法getSummaries中加上如下代码就ok了 this.$nextTick(() > {this.$refs.summaryTab.doLayout(); }); 没用使用自定义合计计算函数的,也可以写在updated中,如下: updated() {this.$nextTick((…

关于ipad:无法验证服务器身份

ipad 连接网络后&#xff0c;有时候会冒出这个弹窗&#xff0c;并且关掉后仍继续弹出 可以尝试以下几种方法&#xff1a;&#xff08;我是用③解决的&#xff09; ①. 确保你的iPad连接的是稳定的网络。有时候网络连接不稳定会导致无法验证服务器身份。 我们学校这个校园网…

Karl Guttag评Vision Pro(三):为什么飞机上VR观影体验不佳?

在过去25年里&#xff0c;AR/VR头显显示技术得到长足发展&#xff0c;采用的屏幕规格越来越高。据早前报告预测&#xff0c;VR头显安装基数会在2023年达到约2500万台。尽管如此&#xff0c;相比于无处不在的手机&#xff0c;我们几乎看不到周围有人随身携带AR/VR头显&#xff0…

APP为什么没有被小程序取代呢?

在科技行业日新月异的发展下&#xff0c;一直存在一种声音&#xff0c;认为小程序将逐步取代APP。然而&#xff0c;事实却并非如此。APP至今仍然以其独特的优势&#xff0c;坚挺地存在于市场之中。这是为何呢&#xff1f;以下是我们对此的几点考察。 首先&#xff0c;APP在功能…

「RPA中国杯 · 第五届RPA极客挑战赛」成功举办及获奖名单公示

2023年6月26日&#xff0c;「RPA中国杯 第五届RPA极客挑战赛」在苏州国际博览中心圆满结束。本次挑战赛由RPA中国和全球人工智能产品应用博览会主办&#xff0c;容智信息、金智维、弘玑Cyclone、UiPath联合主办&#xff0c;centific、中投创展协办。 RPA已经成为提高企业生产…

uniapp 详细封装缓存定时过期方法,详细使用过程

最近在开发一个uniapp的项目&#xff0c;中间我们需要给缓存定时&#xff0c;为了解决这个问题&#xff0c;封装了一个方法用来解决这个问题&#xff0c;当时遇到这个问题是因为在项目中要给阿里的OSS上传文件&#xff0c;上传之间先要向服务端请求获取授权&#xff0c;授权我们…

3、动手学深度学习——多层感知机:多层感知机的实现(从零实现+内置函数实现)

1、多层感知机基础知识 1. 简述 加入隐藏层和激活函数&#xff0c;可以将线性模型变成非线性模型&#xff0c;引入了非线性拟合能力。 我们通过在网络中加入一个或多个隐藏层来克服线性模型的限制&#xff0c;使其能处理更普遍的函数关系类型。要做到这一点&#xff0c;最简…

密码学—DES加密算法

文章目录 DES流程DES细节生成密钥DES加密E盒扩展S盒替换P盒置换 DES流程 因为DES是对比特流进行加密的&#xff0c;所以信息在加密之前先转为二进制比特流 1&#xff1a;生成16把密钥 只取给出的密钥比特流中64位&#xff0c;不够64则补0对64位进行PC1表置换&#xff0c;64位进…

vscode搭建汇编环境

汇编语言环境的配置 教程 视频教程 https://www.nasm.us/pub/nasm/releasebuilds/?CM;OD 下载zip压缩包&#xff0c;去目录去解压&#xff0c;然后把根目录配置到环境的变量 vscode搭建汇编环境 插件 assembly Hex editor 这个是用来显示.exe文件的十六字进制的显示 下载…

基于 DTS 同步 MySQL 全增量数据至 CKafka,构建实时数仓的最佳实践

背景介绍 随着 IT 技术与大数据的不断发展&#xff0c;越来越多的企业开始意识到数据的价值&#xff0c;通过大数据分析&#xff0c;可以帮助企业更深入地了解用户需求、更好地洞察市场趋势。目前大数据分析在每个业务运营中都发挥着重要作用&#xff0c;成为企业提升市场竞争…

【最短路dij】牛客练习赛112D qsgg and Subway

D-qsgg and Subway_牛客练习赛112 (nowcoder.com) 题意&#xff1a; 思路&#xff1a; 感觉这类题难的地方就是更新v的那个值比较难求 思路&#xff1a; #include <bits/stdc.h>#define int long longusing namespace std;const int mxn1e610; const int mxe1e610; co…

G1垃圾回收参数调优及MySQL虚引用造成GC时间过长分析 | 京东云技术团队

1. 背景 我方有一应用&#xff0c;偶尔会出现GC时间过长&#xff08;间隔约4小时&#xff09;&#xff0c;导致性能波动的问题(接口最长需要耗时3秒以上)。经排查为G1垃圾回收器参数配置不当 叠加 MySQL 链接超过闲置时间回收&#xff0c;产生大量的虚引用&#xff0c;导致G1在…

wordpress里的日主题ripro登录一直返回0,或者循环登录

如以下网站&#xff1a;爱豆坤坤博客_最爱蔡徐坤&#xff0c;专注活动&#xff0c;软件&#xff0c;资源&#xff0c;教程分享!。点击登录后一直提示登录。或者返回0.具体原因是因为插件乱用导致。需要查看文件wp-load.php 删除最后的include("/www/wwwroot/25qi.cn/wp-co…

c语言通讯录——文件版本(带详细文字解释)

1.定义一个用于存储一个人的信息的结构体 typedef struct PeoInfo {char name[NAME_MAX];int age;char sex[SEX_MAX];char addr[ADDR_MAX];char tele[TELE_MAX]; }PeoInfo;定义了一个名为 “PeoInfo” 的结构体&#xff08;struct&#xff09;类型&#xff0c;用于存储有关一个…

想知道AI智能绘画是什么?三分钟告诉你如何生成ai绘画

你是否曾经幻想过让电脑也能像大师一样创作出美丽的艺术作品&#xff1f;AI智能绘画就是这样一门神奇的技术&#xff0c;它将人工智能与绘画艺术相结合&#xff0c;为我们呈现了一场令人惊叹的创造魔术。那么到底AI智能绘画是什么呢&#xff1f;让我们一起揭开它的神秘面纱&…

低代码平台其中两大优势

低代码开发平台本质上是一种的软件开发工具&#xff0c;通过把常用功能控件进行组件化封装、将常用业务场景进行模板化&#xff0c;通过可视化模式进行进行开发。相比传统编码开发模式具有开发效率高、开发成本更低的明显优势。 低代码开发是如何提高开发效率和降低成本的呢&am…