Elasticsearch查询及聚合类DSL语句宝典示例详解

更新时间：2023年01月03日 14:27:04 作者：京东云开发者

这篇文章主要为大家介绍了Elasticsearch查询及聚合类DSL语句宝典示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

前言

随着使用es场景的增多，工作当中避免不了去使用es进行数据的存储，在数据存储到es当中以后就需要使用DSL语句进行数据的查询、聚合等操作，DSL对SE的意义就像SQL对MySQL一样，学会如何编写查询语句决定了后期是否能完全驾驭ES，所以至关重要，本专题主要是分享常用的DSL语句，拿来即用。

一、match

如果match 查询数字，日期，布尔值或者not_analyzed 的字符串时，会精确匹配搜索值，不做分词解析；如果match 查询全文本，会对查询词做分词解析，然后搜索。

比如对keyword 类型的tag 查询，"京东总部"不会分词，必须完全相等的词才会被搜索出来

{
  "query": {
    "match": {
        "content" : {
            "tag" : "京东总部"
        }
    }
  }
}

比如"宝马多少马力"会被分词为"宝马多少马力", 所有有关"宝马多少马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分

{
  "query": {
    "match": {
        "content" : {
            "query" : "宝马多少马力"
        }
    }
  }
}

二、match_phrase

如果想要精确匹配所有同时包含"宝马多少马力"的文档，就要使用 match_phrase 了

{
  "query": {
    "match_phrase": {
        "content" : {
            "query" : "宝马多少马力"
        }
    }
  }
}

三、mult_match

如果我们希望两个字段进行匹配，其中一个字段有这个文档就满足的话，使用multi_match

{
  "query": {
    "multi_match": {
        "query" : "我的宝马多少马力",
        "fields" : ["title", "content"]
    }
  }
}

四、term

关键字精确匹配，不分词解析。注意 term 包含（contains）操作，而非等值（equals）判断。如果文档包含full_text 及其他词，也会命中返回。

使用term要确定的是这个字段是否“被分析”(analyzed)，默认的字符串是被分析的。

比如下面的例子，其中的full_text是被分析过的，所以full_text的索引中存的就是[quick, foxes]，而extra_value中存的是[Quick Foxes!]

PUT my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "full_text": {
          "type":  "string"
        },
        "exact_value": {
          "type":  "string",
          "index": "not_analyzed"
        }
      }
    }
  }
}
PUT my_index/my_type/1
{
  "full_text":   "Quick Foxes!",
  "exact_value": "Quick Foxes!"  
}

请求不出数据的，因为full_text分词后的结果中没有[Quick Foxes!]这个分词

GET my_index/my_type/_search
{
  "query": {
    "term": {
      "full_text": "Quick Foxes!"
    }
  }
}

五、terms

指定多值精确匹配，如果字段包含了指定值中的任何一个值，那么文档满足条件。类似sql中的in

{
    "terms": {
        "tag": [
            "search",
            "full_text",
            "nosql"
        ]
    }
}

六、range

数字/时间的区间查询，操作符：

•gt > greater than

•gte >=

•lt < litter than

•lte <=

{
  "query":{
    "range": {
        "age": {
            "gte":  20,
            "lt":   30
        }
    }
  }
}

七、wildcard

通配符索引。* 表示全匹配，？表示单一匹配。扫描所有倒排索引，性能较差

{ 
  "query": { 
    "wildcard": { 
      "companyName": "*京东*" 
    } 
  } 
}

八、regexp

正则索引。扫描所有倒排索引，性能较差

{ 
    "query": { 
        "regexp": { 
            "postcode": "W[0-9].+" 
        } 
    } 
}

九、组合多查询（bool查询）

bool 查询后面可以跟这四种匹配模式

•must 必须匹配

•must_not 必须不匹配

•should 匹配任意，等价or

•filter 必须匹配：过滤模式

比如我们想要请求"content 中带宝马，但是tag 中不带宝马"这样类似的需求，就需要用到bool 联合查询。

{
    "query":{
        "bool":{
            "must":{
                "term":{
                    "content":"宝马"
                }
            },
            "must_not":{
                "term":{
                    "tags":"宝马"
                }
            }
        }
    }
}

十、聚合

聚合包含一下两种：

1、指标聚合（Metric Aggregation）：一些数学运算，可以对文档字段进行统计分析

•输出一个值

▪min

▪max

▪sum

▪avg

▪ value_count 统计某字段有值的文档数

▪ cardinality 某字段值去重计数

•输出多个值

▪stats

▪percentiles

▪percentile_ranks

2、桶聚合（Bucket Aggregation）：一些列满足特定条件的文档的集合，相当于sql 的groupby

•terms 对某个字段统计每个不同的内容，以及出现文档的个数

•range 某个范围内文档的个数

默认聚合范围是全文，但是如果有query查询，那么聚合的范围就是query查询的结果。

value_count 统计某字段有值的文档数

{
  "size": 0, 
  "aggs": {
    "count": {
      "value_count": {
        "field": "companyName"
      }
    }
  }
}

指定查询语句进行统计

{
  "query": {
    "term": {
      "companyName": "安徽科达智慧能源科技有限公司"
    }
  },
  "aggs": {
    "count": {   //自定义名称
      "terms": {
        "field": "companyName"
      }
    }
  }
}

以上就是本期分享的DSL语句，小伙伴们结合自己的使用查询场景进行操练起来吧。

以上就是Elasticsearch查询及聚合类DSL语句宝典示例详解的详细内容，更多关于Elasticsearch查询聚合类DSL的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

关于kafka发送消息的三种方式总结
这篇文章主要介绍了关于kafka发送消息的三种方式总结，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-04-04
在Spring Boot中如何使用Cookies详析
这篇文章主要给大家介绍了关于在Spring Boot中如何使用Cookies的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者使用Spring Boot具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧
2019-11-11
Java 实战项目锤炼之嘟嘟健身房管理系统的实现流程
读万卷书不如行万里路，只学书上的理论是远远不够的，只有在实战中才能获得能力的提升，本篇文章手把手带你用java+SSM+jsp+mysql+maven实现一个健身房管理系统,大家可以在过程中查缺补漏，提升水平
2021-11-11
Java模拟实现斗地主的洗牌和发牌
这篇文章主要为大家详细介绍了Java模拟实现斗地主的洗牌和发牌，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-04-04
Java 程序员容易犯的10个SQL错误
本文介绍了Java 程序员容易犯的10个SQL错误。具有很好的参考价值，下面跟着小编一起来看下吧
2017-01-01
Spring Bean生命周期之属性赋值阶段详解
这篇文章主要为大家详细介绍了Spring Bean生命周期之属性赋值阶段，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2022-03-03
Spring Boot整合Redis的完整步骤
这篇文章主要给大家介绍了关于Spring Boot整合Redis的完整步骤，文中通过示例代码介绍的非常详细，对大家学习或者使用Spring Boot具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧
2019-05-05
Springboot动态配置AOP切点详解
这篇文章主要介绍了Springboot动态配置AOP切点详解,Springboot 可以定义注解切点去拦截注解修饰的类方法以及execution(xxxx)切点去拦截具体的类方法,默认情况下我们都会使用注解@PointCut去定义切点,然后定义切面拦截切点,需要的朋友可以参考下
2023-09-09
教你在 IntelliJ IDEA 中使用 VIM插件的详细教程
这篇文章主要介绍了在 IntelliJ IDEA 中使用 VIM的教程,本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-05-05
Java DirectByteBuffer堆外内存回收详解
这篇文章主要为大家详细介绍了Java中发DirectByteBuffer堆外内存回收，文中的示例代码讲解详细，具有一定的借鉴价值，需要的可以参考一下
2022-10-10