【Elasticsearch】查询并删除匹配文档之_delete_by_query

997 阅读2分钟

思路:先查询确认,后精准删除

假设我想删除title是”小明今晚真的不加班“这条记录,先查看一下现有的记录:

(不加班不好吗?为什么要删除呢?)

tips:可以使用match_phrase精准查询,查询命令可以通过curl查询,也可以通过其他工具请求(其实道理都一样)

curl -X POST "http://192.168.16.65:9211/blog/_search" -H 'Content-Type: application/json' -d'
{
    "query": {
        "match_phrase": {
            "title": "小明今晚真的不加班"
        }
    }
}
'

blog为索引,_search为es的查询指令,查询结果如下:

{
    "took": 13,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 1,
            "relation": "eq"
        },
        "max_score": 110.28655,
        "hits": [{
            "_index": "blog",
            "_type": "_doc",
            "_id": "6a0d343fb629da2e2cdf6f4bf250af04",
            "_score": 110.28655,
            "_source": {
                "author": "程序员小明",
                "capture_time": 1583820020000,
                "content": "今晚可以终于可以王者荣耀带妹了",
                "title": "小明今晚真的不加班",
                "top_domain": "mynamecoder.com",
                "url": "http://blog.mynamecoder.com"
            }
        }]
    }
}

可以看到数据中有一条符合条件的文档,我们现在就要删除该文档。

删除title为"小明今晚真的不加班"的文档(忍痛):

curl -X POST "http://192.168.16.65:9211/blog/_delete_by_query" -H 'Content-Type: application/json' -d'
{
  "query":{
    "match":{
      "title":"小明今晚真的不加班"
    }
  }
}
'

tips: 使用_delete_by_query时,必须指定索引,此处blog就是索引,_delete_by_query是elasticsearch的删除指令

删除结果:

{
  "took" : 147,
  "timed_out": false,
  "deleted": 1,
  "batches": 1,
  "version_conflicts": 0,
  "noops": 0,
  "retries": {
    "bulk": 0,
    "search": 0
  },
  "throttled_millis": 0,
  "requests_per_second": -1.0,
  "throttled_until_millis": 0,
  "total": 119,
  "failures" : [ ]
}

重点关注total(查询到的条数)和deleted(删除的总数)两个字段,最后不放心的话,可以再查询一下刚才那个文档是否还存在。

tips:es执行删除的时候es并不是立即删除,虽然我们再次查询已经找不到了,但es自身是将该文档先标记准备删除状态,一段时间后,异步删除。