当前位置：比丘资源网 > 图文资讯 > 插件资讯 > es笔记四之中文分词插件安装与使用

admin 插件资讯 2022-12-27

es笔记四之中文分词插件安装与使用

es笔记四之中文分词插件安装与使用

前面我们介绍的操作及演示都是基于英语单词的分词，但我们大部分使用的肯定都是中文，所以如果需要使用分词的操作肯定也是需要使用中分分词。

这里我们介绍一下如何安装中文分词插件。

在介绍安装之前，我们可以先来测试一下没有中文分词的分词效果，我们先来插入一条数据：

PUT /exam/_doc/16{ “name” : “张三丰”, “address”: “一个苹果”}复制代码

如果是中文分词，我们可以想到 ‘一个苹果’ 应该会被分为 ‘一个’ 和 ‘苹果’ 这两个词，但是默认的分词是无法这样分词的，我们可以尝试搜索一下：

GET /exam/_search{ “query”: { “term”: { “address”: “一个” } }}复制代码

可以发现是无法搜索到结果的。

我们可以查看一下这条数据的 address 字段被分词的结果：

GET /exam/_doc/16/_termvectors?fields=address复制代码

其中，_doc 后面的 16 是我们要查询的数据的 id，fields 后面跟着的要查看的分词结果的字段名。

可以看到一个苹果这个字符串，被挨个分成了四个。

然后我们来安装一下中文分词的插件。

安装中文分词插件

在 elasticsearch 安装的目录下，执行下面的语句：

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.6.0/elasticsearch-analysis-ik-7.6.0.zip复制代码

这里我们安装的是 7.6.0 版本的 es，所以安装对应的分词插件。

然后我们重新建立这个 index，为 address 字段加上指定的分词插件：

挨个执行下面的命令：

DELETE /exam/PUT /examPUT /exam/_mapping{ “properties”: { “address”: { “type”: “text”, “analyzer”: “ik_max_word”, “fields”: { “keyword”: { “type”: “keyword”, “ignore_above”: 256 } } }, “name”: { “type”: “keyword” } }}复制代码

这里，和第一次创建 mapping 的时候比，多了一行 analyzer 的定义。

然后我们再次重复上面的插入和查询操作：

PUT /exam/_doc/16{ “name” : “张三丰”, “address”: “一个苹果”}GET /exam/_search{ “query”: { “term”: { “address”: “一个” } }}复制代码

可以看到，这次我们搜索一个，就可以查询到数据了。

然后我们看下这条数据的 address 的分词结果：

GET /exam/_doc/16/_termvectors?fields=address复制代码

可以看到，这次返回的结果除了单独的 ‘一’ 和 ‘个’ 之外，还有被分成整体的 ‘一个’ 和 ‘苹果’。

查看分词结果

这里额外介绍一下如何查看字符串的分词。

如果我们有一个字符串，想要知道它会被如何分词，可以直接使用下面的命令：

POST /_analyze{ “analyzer”: “ik_smart”, “text”: “一个苹果”}复制代码

其中，analyzer 是指定的分词的插件，如果不指定就会使用默认的分词功能。

中文分词插件的github 地址如下：github.com/medcl/elast…

本文首发于本人微信公众号：【Django笔记】。

比丘资源网 » es笔记四之中文分词插件安装与使用

admin VIP

分享到：

相关推荐

pr2020全套插件一键安装下载

pr2020全套插件一键安装下载

解决Sublime Text删除插件后在启动时弹出提示框的问题

解决Sublime Text删除插件后在启动时弹出提示框的问题

pr插件下载好了怎么装,磁力链接

pr插件下载好了怎么装,磁力链接

15款好用超赞的chrome插件，开发者们的必备~

15款好用超赞的chrome插件，开发者们的必备~

iPhone越狱后必装的插件(超多)

iPhone越狱后必装的插件(超多)

Revit插件：建模插件橄榄山快模 for Revit2016

Revit插件：建模插件橄榄山快模 for Revit2016

【图文并茂】六十多个 VSCode 插件，打造最强编辑器

【图文并茂】六十多个 VSCode 插件，打造最强编辑器

如何在3DMAX中不使用Maxscript或插件破碎物体对象

如何在3DMAX中不使用Maxscript或插件破碎物体对象

Android插件化动态加载apk

Android插件化动态加载apk

炉石战棋：酒馆网络出bug，打赢战斗还是判负，难道只能用插件

炉石战棋：酒馆网络出bug，打赢战斗还是判负，难道只能用插件

英文润色插件

AE Shapes Blender 插件下载

AE Shapes Blender 插件下载

@Controller与@RestController的区别

@Controller与@RestController的区别

adobe AE安装包下载：Adobe AE中Keylight抠图怎么用

adobe AE安装包下载：Adobe AE中Keylight抠图怎么用

集合竞价怎么选股？集合竞价选股绝招是什么？

集合竞价怎么选股？集合竞价选股绝招是什么？

快手极速版邀请码在哪

大学英语二综合训练

歌词编辑器绿色电脑版下载

真灵动岛安卓下载oppo

快手极速版能赚钱吗是真的安全吗？快手极速版一天能赚多少钱?

快手极速版能赚钱吗是真的安全吗？快手极速版一天能赚多少钱?

建筑工地一般常用的木方是什么什么规格？重量是多少？

建筑工地一般常用的木方是什么什么规格？重量是多少？

爱思助手极速版免费下载

悟饭游戏厅gba文件在哪里悟饭游戏厅gba文件位置介绍

悟饭游戏厅gba文件在哪里悟饭游戏厅gba文件位置介绍

尾盘涨停的股第二天一般怎么走？

尾盘涨停的股第二天一般怎么走？

发表回复取消回复

要发表评论，您必须先登录。

提供最优质的资源集合

立即查看了解详情