1.修改配置文件 IKAnalyzer.cfg.xml 中的 remote_ext_dict 路径
http://localhost:8080/token/dic.txt
2.在 localhost 中的 tomcat 指定的位置放入自己定义的分词文件,每行只有一个词,如在 dic.txt 中:
中华人民共和国
华夏民族
3.重启es,等待读取即可。
4.可以直接使用 ik_smart 分析写入 dic.txt 中的词,如果能完整作为一个词输入则成功。
kibana 终端输入:
GET _analyze
{
"text": "中华人民共和国",
"analyzer": "ik_smart"
}
输出:
{
"tokens" : [
{
"token" : "中华人民共和国",
"start_offset" : 0,
"end_offset" : 7,
"type" : "CN_WORD",
"position" : 0
}
]
}