elasticsearch 中 ik 通过远程文件实现分词热更新

483 阅读1分钟

1.修改配置文件 IKAnalyzer.cfg.xml 中的 remote_ext_dict 路径

http://localhost:8080/token/dic.txt

2.在 localhost 中的 tomcat 指定的位置放入自己定义的分词文件,每行只有一个词,如在 dic.txt 中:

    中华人民共和国
    华夏民族

3.重启es,等待读取即可。

4.可以直接使用 ik_smart 分析写入 dic.txt 中的词,如果能完整作为一个词输入则成功。

kibana 终端输入:

GET _analyze
{
  "text": "中华人民共和国",
  "analyzer": "ik_smart"
}

输出:
    
{
  "tokens" : [
    {
      "token" : "中华人民共和国",
      "start_offset" : 0,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 0
    }
  ]
}