elasticsearch hanlp 插件安装操作
- 下载 hanlp 插件
- 上传hanlp插件到elasticsearch服务器
- 安装hanlp插件
- kibana测试
下载 hanlp 插件
这里大家根据自己对应的 elasticsearch 版本下载匹配版本的 hanlp 插件,由于 hanlp 及 elasticsearch 各个版本之间差别较大,如果版本不匹配可能导致 hanlp 插件安装失败或者安装之后不可用,这里我们用的 elasticsearch 版本是6.7.1,因此我下载的 hanlp 插件版本也是6.7.1,已经放在了百度网盘,插件地址:
链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq
提取码:fteq 有需要的可以去下载。
另外需要其他版本 hanlp 插件的可以去 github 上面下载,下载地址: https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的 hanlp 插件
上传hanlp插件到elasticsearch服务器
这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过 cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个 ES_HOME 的概念,这里需要提前说明一下,对于我的服务器来说, ES_HOME 路径就是 /elk6.7.1/elasticsearch-6.7.1
安装hanlp插件
切换到es对应的插件文件夹 plugins 下,创建 hanlp 文件夹 analysis-hanlp
cd ES_HOME/plugins/
mkdir analysis-hanlp
切换到 analysis-hanlp 文件夹下,上传文件 elasticsearch-analysis-hanlp-6.7.1.zip 或者将上面已经上传好的文件通过命令 cp 、 mv 拷贝至 analysis-hanlp 文件夹下
cd analysis-hanlp
rz 本地文件地址
解压 hanlp 插件文件 elasticsearch-analysis-hanlp-6.7.1.zip
unzip elasticsearch-analysis-hanlp-6.7.1.zip
解压完成之后回到 ES_HOME 下的 config 文件夹下创建 analysis-hanlp 文件夹
cd ES_HOME/config/
mkdir analysis-hanlp
切换到 hanlp 插件解压后文件的 config 文件夹中,拷贝 config 文件夹下的文件到 ES_HOME 下的 config 文件夹下的 analysis-hanlp
cd ES_HOME/plugins/analysis-hanlp/config
mv ./* ES_HOME/config/analysis-hanlp/
再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es
cd ES_HOME
chown -R es.es plugins/
chown -R es.es config/
# 重新启动es
至此 elasticsearch hanlp 插件的安装就算完成了,在 kibana 上面测试
kibana测试
测试代码如下
POST _analyze
{
"text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",
"analyzer": "hanlp"
}
测试效果
{
"tokens" : [
{
"token" : "自建",
"start_offset" : 0,
"end_offset" : 2,
"type" : "l",
"position" : 0
},
{
"token" : "底商",
"start_offset" : 2,
"end_offset" : 4,
"type" : "nz",
"position" : 1
},
{
"token" : "转为",
"start_offset" : 4,
"end_offset" : 6,
"type" : "v",
"position" : 2
},
{
"token" : "办公",
"start_offset" : 6,
"end_offset" : 8,
"type" : "vn",
"position" : 3
},
{
"token" : "自用",
"start_offset" : 8,
"end_offset" : 10,
"type" : "vn",
"position" : 4
},
{
"token" : "为什么",
"start_offset" : 11,
"end_offset" : 14,
"type" : "ryv",
"position" : 5
},
{
"token" : "不",
"start_offset" : 14,
"end_offset" : 15,
"type" : "d",
"position" : 6
},
{
"token" : "属于",
"start_offset" : 15,
"end_offset" : 17,
"type" : "v",
"position" : 7
},
{
"token" : "销售",
"start_offset" : 17,
"end_offset" : 19,
"type" : "vn",
"position" : 8
},
{
"token" : "或者",
"start_offset" : 19,
"end_offset" : 21,
"type" : "c",
"position" : 9
},
{
"token" : "视同",
"start_offset" : 21,
"end_offset" : 23,
"type" : "n",
"position" : 10
},
{
"token" : "销售",
"start_offset" : 23,
"end_offset" : 25,
"type" : "vn",
"position" : 11
},
{
"token" : "?",
"start_offset" : 25,
"end_offset" : 26,
"type" : "w",
"position" : 12
}
]
}
测试结果效果图如下
到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。