how2j.cn

下载区
文件名 文件大小
elasticsearch-analysis-ik-6.2.2.zip 4m
步骤 1 : 分词器概念   
步骤 2 : 安装中文分词器   
步骤 3 : 重启 ElasticSearch   
步骤 4 : 测试中文分词效果   

分词器指的是搜索引擎如何使用关键字进行匹配,如 入门 中的关键字:护眼带光源。 如果使用like,那么%护眼带光源%,匹配出来的结果就是要么全匹配,要不都不匹配。
而使用分词器,就会把这个关键字分为 护眼,带,光源 3个关键字,这样就可以找到不同相关程度的结果了。
步骤 2 :

安装中文分词器

edit
ElasticSearch 默认是没有中文分词器的,需要额外安装。
下载右上角的elasticsearch-analysis-ik-6.2.2.zip,然后复制到 ElasticSearch 解压目录下:

C:\Users\X7TI\Downloads\elasticsearch-6.2.2

接着运行如下命令:

C:\Users\X7TI\Downloads\elasticsearch-6.2.2\bin\elasticsearch-plugin install file:\\\\C:\Users\X7TI\Downloads\elasticsearch-6.2.2\elasticsearch-analysis-ik-6.2.2.zip

这样就如图所示安装成功了
注: 为什么不安装github.com上的?

elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.2/elasticsearch-analysis-ik-6.2.2.zip

因为github 有时候连不上呀,这他娘的不靠谱啊~ 所以才下载到本地确保安装成功呀~
注: elasticsearch-analysis-ik-6.2.2.zip 所存放的路径不要有空格,比如放在 program files 这样的路径下就不行了
安装中文分词器
步骤 3 :

重启 ElasticSearch

edit
安装插件后要重启,否则无法生效。
重启很简单。。。就是右上角X掉,然后重新运行elasticsearch.bat
步骤 4 :

测试中文分词效果

edit
在 kibana 控制台中输入如下命令:
打开 kibana控制台:

http://localhost:5601/app/kibana#/dev_tools/console?_g=()

运行如下命令:

GET _analyze
{
"analyzer":"ik_max_word",
"text":"护眼带光源"
}

返回如图所示的分词效果
注: 要运行kibana控制台,需要先安装kibana: 下载kibana并启动
测试中文分词效果


HOW2J公众号,关注后实时获知最新的教程和优惠活动,谢谢。


问答区域    
2019-03-19 这个中文分词器插件的分词规则怎么修改啊
Michael-Tyson

比如上面的“护眼带光源”,总共可以拆分为“护眼”、“眼带”(医学名词)、“带光源”、“带光”、“光源”、“眼光”、“护带”等词啊,上面的分词器分的感觉不够呀




3 个答案

Maksim
答案时间:2020-06-29
printf("你这是排列组合");
printf("你这是排列组合");

zhjynet
答案时间:2020-04-02
同九年,汝何秀?
printf("墙都不服,舅服你");

轩辕剑宸
答案时间:2019-10-25
你这是分词吗?你这是组词好吧



回答已经提交成功,正在审核。 请于 我的回答 处查看回答记录,谢谢
答案 或者 代码至少填写一项, 如果是自己有问题,请重新提问,否则站长有可能看不到




2018-09-12 关于kibana的数据来源
Anshay

这个kibana的数据来源是哪里?不是很明白,是直接在安装包里面了,还是说请求了远程的数据库?




1 个答案

qugengting
答案时间:2019-02-28
我猜这里还没有数据源,只是把你要搜的key值给处理了下分词了而已



回答已经提交成功,正在审核。 请于 我的回答 处查看回答记录,谢谢
答案 或者 代码至少填写一项, 如果是自己有问题,请重新提问,否则站长有可能看不到




2018-03-19 步骤二安装中文分词器




提问之前请登陆
提问已经提交成功,正在审核。 请于 我的提问 处查看提问记录,谢谢
关于 工具和中间件-搜索引擎技术-中文分词器 的提问

尽量提供截图代码异常信息,有助于分析和解决问题。 也可进本站QQ群交流: 635924385
提问尽量提供完整的代码,环境描述,越是有利于问题的重现,您的问题越能更快得到解答。
对教程中代码有疑问,请提供是哪个步骤,哪一行有疑问,这样便于快速定位问题,提高问题得到解答的速度
在已经存在的几千个提问里,有相当大的比例,是因为使用了和站长不同版本的开发环境导致的,比如 jdk, eclpise, idea, mysql,tomcat 等等软件的版本不一致。
请使用和站长一样的版本,可以节约自己大量的学习时间。 站长把教学中用的软件版本整理了,都统一放在了这里, 方便大家下载: https://how2j.cn/k/helloworld/helloworld-version/1718.html

上传截图