ElasticSearch 笔记二 (ik 分词器安装自定义字典,rest 风格操作)

335 阅读3分钟

这是我参与8月更文挑战的第10天,活动详情查看:8月更文挑战

什么是IK 分词器?

分词:即把一段中文或者别的划分成一个个的关键字,我们子啊搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词,比如 “我是美女”就会被分成 “我”,“是”,“美”,“女” 这显然是不符合要求的,所以我们需要安装中文分词器ik 来解决这个问题。 IK 提供了两个分词算法:IK_smart 和ik_max_word 其中ik_smart 为最少切分,ik_max_word 为最细粒度划分!

下载IK 分词器

下载地址 Ik 其实就是一个插件,下载完后我们可以直接解压到es 中 在这里插入图片描述

**重启我们的es 和 kibana **

打开我们的kibanna 进行一些使用

ik_samart 的操作

在这里插入图片描述 ik_max_word 的拆分 在这里插入图片描述

两者之间的差别

ik_samart 会做到最粗粒度的拆分,也就是最小粒度的拆分 ik_max_word 会做到最细粒度的拆分 。可以分成多个的词

ik 分词器自定义

加入我们现在搜索一下冯娇娇是美女 在这里插入图片描述

当我们出现有的词ik 里没有但是我们又需要,这个时候我们就可以自定义分词 在我们的config 里面点击这个xml 文件 在这里插入图片描述 我们点击后看到我们可以自己写上我们的配置在这里插入图片描述 自己编写一个后缀名为.dic的文件名。我们可以在里面写一些我们需要的词。然后加入到我们的配置文件中,重启我们的es. 在这里插入图片描述 加入到我们的配置文件中 在这里插入图片描述 重启再次运行,我的名字就没有被分开 在这里插入图片描述

Rest 风格说明

一种软件架构风格,而不是标准,只是提供了一组设计原则和约束条件,它主要用于客户端和服务器交互类的软件,基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。 在这里插入图片描述

基础测试

指定文档id 创建一个文档(索引test1 与类型 type1 自动创建的)

PUT /索引名/类型名/文档id
{
请求体
}

在这里插入图片描述 在这里插入图片描述

在这里插入图片描述 在这里插入图片描述 完成自动添加索引。数据也成功添加了。

上面我们的案例demo 没有设置字段的属性。其实我们的ElasticSearch 也是可以添加字段属性的,跟我们的关系型数据库

ElasticSearch 的类型 1,字符串类型 text ,keyword 2,数值类型 long,integer,short,byte,double,float,scaled float 3,日期类型 date 4,te 布尔值类型 boolean 5,二进制类型 binary .....

指定字段的类型

在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 查看默认的 在这里插入图片描述 在这里插入图片描述

**修改 提交 还是使用 put **

覆盖的方式修改

在这里插入图片描述

直接用update 的方式修改

在这里插入图片描述 在这里插入图片描述

删除索引

在这里插入图片描述 在这里插入图片描述 删除成功了! 根据请求 删除索引 还是删除库下的文档!!

完结!持续更新!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!