深入理解elasticsearch复杂查询条件:NULL值与OR逻辑
本文将详细讲解如何在Elasticsearch中构建复杂的查询条件,尤其是在处理包含NULL值和OR逻辑的复杂筛选场景下。 我们将以一个实际问题为例,阐述如何正确编写ES查询语句。
问题描述: 需要构建一个ES查询,满足以下多条件筛选需求:item_code = “zjdl_013” 并且 effective_flag = 1 并且 delete_flag = 0 并且 (start_time 为NULL 或 start_time 小于等于 2023-02-08) 并且 (end_time 为NULL 或 end_time 小于等于 2023-02-08)。
错误的查询方式及原因: 直接将上述条件转换为ES查询语句时,可能会错误地使用exists和range查询在一个should子句中。 这是因为should子句表示满足其中任意一个条件即可,而exists和range查询针对的是同一字段,逻辑上相互独立,不能简单地放在一起。
正确的查询方式: 正确的做法是将对start_time和end_time的条件分别拆分成两个独立的bool查询,每个bool查询都包含一个should子句,分别处理NULL值和日期范围。 每个should子句包含一个exists查询(检查字段是否存在)和一个range查询(检查日期范围)。只有当字段存在且满足日期范围条件,或者字段不存在时,该条件才被认为满足。
修改后的ES查询语句:
GET index_three_catalogues/_search { "query": { "bool": { "must": [ { "match": { "item_code.keyword": "ZJDL_013" } }, { "match": { "effective_flag": 1 } }, { "match": { "delete_flag": 0 } }, { "bool": { "should": [ { "exists": { "field": "start_time" } }, { "range": { "start_time": { "lte": "2023-02-08", "format": "yyyy-MM-dd" } } } ] } }, { "bool": { "should": [ { "exists": { "field": "end_time" } }, { "range": { "end_time": { "lte": "2023-02-08", "format": "yyyy-MM-dd" } } } ] } } ] } } }
此查询语句正确地处理了NULL值和日期范围,并清晰地表达了OR逻辑。 通过将start_time和end_time的条件分别处理,避免了原始语句中的逻辑错误,确保查询结果的准确性。