在SQL中,group by语句不仅可以直接按字段分组,也可以在字段上调用函数后分组。例如一个表中存储用户数据,name字段为用户的姓名,如果需要统计各个姓氏的用户个数,使用SQL如下
select count(*), SUBSTRING(name,1,1)
from user
group by SUBSTRING(name,1,1)
同理,Elasticsearch中使用Terms Aggregation进行聚合运算,但是很多同学不知道的是,这里面可以利用script来生成聚合的term而非必须使用原来的字段,那么使用的DSL如下
GET user/user/_search
{
"size": 0,
"aggs": {
"genres": {
"terms": {
"script": {
"inline": "doc['name'].value.substring(0, 1)"
}
}
}
}
}
可以看到使用了doc['name'].value.substring(0, 1)
作为聚合的term,即按照用户的姓氏进行聚合而非用户的姓名。这里的script是Painless,是Elasticsearch中默认支持的脚本语言,其语法和Groovy非常类似。