手记

Elasticsearch自定义聚合term

在SQL中,group by语句不仅可以直接按字段分组,也可以在字段上调用函数后分组。例如一个表中存储用户数据,name字段为用户的姓名,如果需要统计各个姓氏的用户个数,使用SQL如下

select count(*), SUBSTRING(name,1,1)
from user
group by SUBSTRING(name,1,1)

同理,Elasticsearch中使用Terms Aggregation进行聚合运算,但是很多同学不知道的是,这里面可以利用script来生成聚合的term而非必须使用原来的字段,那么使用的DSL如下

GET user/user/_search
{
  "size": 0,
  "aggs": {
    "genres": {
      "terms": {
        "script": {
          "inline": "doc['name'].value.substring(0, 1)"
        }
      }
    }
  }
}

可以看到使用了doc['name'].value.substring(0, 1)作为聚合的term,即按照用户的姓氏进行聚合而非用户的姓名。这里的script是Painless,是Elasticsearch中默认支持的脚本语言,其语法和Groovy非常类似。

0人推荐
随时随地看视频
慕课网APP