Elasticsearch嵌套数组筛选：如何高效查找指定年份内特定事件数量不小于N的文档？-小浪学习网

Elasticsearch嵌套数组筛选：如何高效查找指定年份内特定事件数量不小于N的文档？

elasticsearch嵌套数组高效筛选指南

在Elasticsearch中，针对包含嵌套数组并满足特定条件的文档进行高效查询，是一个常见挑战。本文将详细阐述如何处理包含change_records数组的文档，并基于change_time字段在指定年份内数量的条件进行精确筛选。

问题描述： 假设索引包含如下结构的数据：

{   "id": 1,   "change_records": [     { "change_time": 1646039270000 },     { "change_time": 1653728870000 },     { "change_time": 1658999270000 },     { "change_time": 1627463270000 }   ] }

目标是查询满足以下条件的文档：change_records数组中，change_time字段在指定年份（例如，年份M）范围内的值的数量不少于N个。

直接使用脚本查询可能导致“字段不存在”错误，这是因为Elasticsearch中直接访问doc[‘change_records’]的方式并非总是有效。

解决方案： 推荐使用script_score查询，结合Painless脚本进行自定义评分。此方法可有效规避直接访问嵌套数组的限制，通过自定义评分函数判断是否满足条件。

具体实现：

构建script_score查询：

{   "query": {     "script_score": {       "query": {  // 可在此处添加其他查询条件         "match_all": {}       },       "script": {         "source": """           int matches = 0;           for (Map record : doc['change_records']) {             long changeTime = record['change_time'];             if (changeTime >= params.start && changeTime <= params.end) {               matches++;             }           }           return matches >= params.n ? 1 : 0;         """,         "params": {           "start": 1609459200000, // 年份M的开始时间戳           "end": 1640995199999,   // 年份M的结束时间戳           "n": 1                 // N的值         }       }     }   } }

代码说明：