Elasticsearch 映射 fielddata 工作原理解析

 更新时间:2025年06月11日 10:06:24   作者:G皮T  
在 Elasticsearch 中,fielddata 是一种在内存中构建的索引,用于加速某些类型的查询,特别是聚合和排序操作,下面通过本文给大家介绍Elasticsearch 映射 fielddata的相关知识,感兴趣的朋友一起看看吧

1.fielddata 是什么

fielddata 是 Elasticsearch 中一种数据结构,用于在内存中缓存字段数据,主要服务于以下场景:

  • 聚合操作(Aggregations)
  • 排序(Sorting)
  • 脚本计算(Scripting)
  • 某些类型的查询(如 field 字段上的 term 查询)

当需要对 text 字段或其他非 doc_values 支持的字段执行上述操作时,Elasticsearch 需要将这些字段的值加载到内存中,这就是 fielddata 的作用。

2.fielddata 的工作原理

  • 按需加载:当第一次需要对某个字段执行聚合 / 排序等操作时,Elasticsearch 会从磁盘读取该字段的所有值并构建内存中的数据结构。
  • 存储在 JVM 堆内存fielddata 会占用 JVM 堆内存空间。
  • 字段级启用:默认情况下,text 字段禁用 fielddatakeyword 字段使用 doc_values 而非 fielddata

3.主要用法

3.1 启用 fielddata(通常在 text 字段上)

PUT my_index/_mapping
{
  "properties": {
    "my_text_field": { 
      "type":     "text",
      "fielddata": true
    }
  }
}

3.2 监控 fielddata 使用情况

GET _nodes/stats/indices/fielddata?fields=*

3.3 清除 fielddata 缓存

POST my_index/_cache/clear?fielddata=true

4.使用场景示例

示例 1:对 text 字段进行聚合

GET my_index/_search
{
  "size": 0,
  "aggs": {
    "my_terms": {
      "terms": {
        "field": "my_text_field"  // 需要该字段启用 fielddata
      }
    }
  }
}

示例 2:对 text 字段进行排序

GET my_index/_search
{
  "sort": [
    {
      "my_text_field": {
        "order": "asc"
      }
    }
  ]
}

5.fielddata 与 doc_values 的区别

特性fielddatadoc_values
构建时机查询时按需构建索引时预先构建
存储位置JVM 堆内存磁盘(操作系统缓存)
内存占用
适用字段类型主要为 text 字段主要为 keyword / numeric / date 等字段
默认启用text 字段默认禁用支持的字段默认启用

6.注意事项

  • 内存消耗fielddata 会显著增加内存使用,特别是高基数(大量唯一值)字段。
  • 性能影响:首次加载 fielddata 可能导致查询延迟。
  • 替代方案:对于 keyword / numeric / date 等字段,优先使用 doc_values
  • 熔断机制:Elasticsearch 有 fielddata 熔断器防止内存耗尽。

7.最佳实践

  • 尽量避免在 text 字段上启用 fielddata
  • 如需对文本进行聚合/排序,考虑使用多字段(multi-field)映射:
"my_field": {
  "type": "text",
  "fields": {
    "keyword": {
      "type": "keyword"
    }
  }
}

然后对 my_field.keyword 进行操作。

监控 fielddata 内存使用,设置合理的熔断阈值。

到此这篇关于Elasticsearch 映射 fielddata 工作原理解析的文章就介绍到这了,更多相关Elasticsearch 映射 fielddata 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Java设计模式七大原则之迪米特法则详解

    Java设计模式七大原则之迪米特法则详解

    迪米特法则要求一个对象应该对其他对象有最少的了解,所以迪米特法则又叫做最少知识原则。本文将为大家详细介绍Java设计模式七大原则之一的迪米特法则,需要的可以参考一下
    2022-02-02
  • Java入门基础之Java的基本语法与Java所支持的数据类型

    Java入门基础之Java的基本语法与Java所支持的数据类型

    这篇文章主要介绍了Java入门基础之Java的基本语法与Java所支持的数据类型,熟悉语法和数据类型通常是了解一种编程语言的开始,需要的朋友可以参考下
    2016-02-02
  • spring MVC搭建及配置详解

    spring MVC搭建及配置详解

    本篇文章主要介绍了spring MVC配置方法,要想灵活运用Spring MVC来应对大多数的Web开发,就必须要掌握它的配置及原理,有兴趣的可以了解一下。
    2017-01-01
  • Java骚操作之CountDownLatch代码详解

    Java骚操作之CountDownLatch代码详解

    这篇文章主要介绍了Java骚操作之CountDownLatch代码详解,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • Spring中ApplicationContextAware的使用方法详解

    Spring中ApplicationContextAware的使用方法详解

    ApplicationContextAware 通过它Spring容器会自动把上下文环境对象调用ApplicationContextAware接口中的setApplicationContext方法,这篇文章主要介绍了Spring中ApplicationContextAware的作用,需要的朋友可以参考下
    2023-03-03
  • java“与”符号写法与用法

    java“与”符号写法与用法

    在本篇文章里小编给大家整理的是关于java“与”符号写法与用法,对此有需要的朋友们可以学习下。
    2020-02-02
  • java对象拷贝常见面试题及应答汇总

    java对象拷贝常见面试题及应答汇总

    在本篇文章里小编给大家整理的是关于java对象拷贝常见面试题的相关内容,需要的朋友们可以学习下。
    2020-02-02
  • 详解Java中static关键字和内部类的使用

    详解Java中static关键字和内部类的使用

    这篇文章主要为大家详细介绍了Java中static关键字和内部类的使用,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-08-08
  • springBoot整合mybatisplus全过程

    springBoot整合mybatisplus全过程

    MyBatisPlus简介及开发步骤,介绍其简化开发、高度可定制及强大的代码生成器等特点,适合数据库操作场景优化
    2026-05-05
  • java项目中使用 Lombok遇到的问题小结

    java项目中使用 Lombok遇到的问题小结

    这篇文章主要介绍了java项目中使用 Lombok遇到的问题小结,需要的朋友可以参考下
    2018-07-07

最新评论