mongoDB中聚合函数java处理示例详解

 更新时间:2019年04月16日 10:11:19   作者:VV不想说话  
这篇文章主要给大家介绍了关于mongoDB中聚合函数java处理的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用mongoDB具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧

1.问题

最近在做项目的时候碰到一个对mongoDB的数据处理,从MongoDB中拿到内嵌文档的时间排序的list。

一开始考虑到直接对mongoDB中的属性排序,后面发现属性存在内嵌文档中,所以处理中需要用到聚合函数。

思考

(key)解决这个问题的过程让我学到很多,发现自己在解决一个问题不仅查找问题的姿势不对,浪费太多时间。而且在碰到问题之后,应该多看看解决办法,甚至解决了之后要去思考问题,回顾问题。而不是像以前一样,解决问题了就万事大吉,抛之脑后。

2.解决

需要对document中的一个tweet_list 集合中的一个属性 timestamp_ms进行排序。 组内排序

使用聚合框架,通过match,unwind,sort等不同的组件创建一个管道。

类似mysql中的多层嵌套子查询。

mongoDB中js代码

db.text.aggregate(
 // Initial document match (uses index, if a suitable one is available)
 [
 { $match: {
  _id : ObjectId("5ca95b4bfb60ec43b5dd0db5")
 }},

 // Expand the scores array into a stream of documents
 { $unwind: '$tweet_list' },
  
  { $match: {
   'tweet_list.timestamp_ms': '1451841845660'
  }},

 // Sort in descending order
 { $sort: {
  'tweet_list.timestamp_ms': 1
 }}
 ]
)

java实现此聚合函数

java中的Aggregation类,查询条件的顺序决定结果。

Aggregation agg = Aggregation.newAggregation(
  Aggregation.match(Criteria.where("_id").is(id)),
  Aggregation.unwind("tweet_list"),
  Aggregation.sort(Sort.Direction.ASC,"tweet_list.timestamp_ms"),
  Aggregation.project("tweet_list.timestamp_ms","tweet_list.text","tweet_list.created_at")

);
AggregationResults<JSONObject> results = mongoTemplate.aggregate(agg, "text", JSONObject.class);
//System.out.println("results"+results.getRawResults()); //获取到的结果是document
//String res = results.getRawResults();
String json = com.mongodb.util.JSON.serialize(results.getRawResults());
System.out.println("JSON serialized Document: " + json);
JSONObject jso= JSON.parseObject(json);
JSONArray resultss=jso.getJSONArray("results");
System.out.println(resultss);

3.扩展

管道pipeline

以下的管道操作符可以按照任意顺序组合在一起使用。每个操作符都会接受一连串文档,对这些文档做了类型转换后,将转换后的文档作为结果传递给下一个操作符。直到最后一个管道操作符,将结果返回给客户端。

筛选match

尽可能将帅选放在管道的前部。两个原因:

1.先过滤掉不需要的文档,减少管道的工作量。

2.如果在project和group之前执行match,查询可以用索引。

3.不能在match中使用地理空间操作符

投射project

类似select操作。可以用管道表达式,数学表达式,日期表达式,字符表达式,逻辑表达式等。

分组group

跟mysql中的分组比较像

排序sort

1 升序 -1 降序

限制limit

限制结果条数

跳过skip

丢弃结果中的前n个文档

拆分unwind

把数组中的每个值拆分为单独的文档,例如此问题中需要对一个document中的tweetlist进行排序,可以使用unwind把tweetlist中的不同map拆分成不同的文档。

结果返回

文档

MapReduce

如果聚合框架中查询语言不能不表达,需要用到MapReduce。

使用:把问题拆分为多个小问题,把各个小问题发送到不同的机器上,每台机器只负责完成一部分的工作,完成之后,再把零碎的解决方案合并。

步骤:

1.映射map:把操作映射到集合中每个文档

2.洗牌shuffle:按照键值分组,并将产生的键值组成列表放到对应的键中。

3.化简reduce:把列表中的值化简成一个单值,值被返回,继续shuffle,然后最终每个键的列表只有一个值,即最终结果,

应用:

1.找到集合中所有键

2.网页分类

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。

相关文章

  • MongoDB分片键的选择和案例实例详解

    MongoDB分片键的选择和案例实例详解

    分片集群中良好的查询性能都依赖于正确选择分片键。下面这篇文章主要给大家介绍了关于MongoDB分片键的选择和案例的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧
    2018-05-05
  • 使用zabbix监控mongodb的方法

    使用zabbix监控mongodb的方法

    MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。通过本文给大家介绍使用zabbix监控mongodb的方法,需要的朋友参考下
    2016-02-02
  • mongodb使用c#驱动数据插入demo

    mongodb使用c#驱动数据插入demo

    今天小编就为大家分享一篇关于mongodb使用c#驱动数据插入demo,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-01-01
  • MongoDB 简单入门教程(安装、基本概念、创建用户)

    MongoDB 简单入门教程(安装、基本概念、创建用户)

    这篇文章主要介绍了MongoDB 简单入门教程(安装、基本概念、创建用户)的相关资料,帮助大家更好的理解和学习使用MongoDB数据库,感兴趣的朋友可以了解下
    2021-03-03
  • MongoDB数据库常用28条查询语句总结

    MongoDB数据库常用28条查询语句总结

    我们经常使用的MySQL是最流行的关系型数据库管理系统,随着时代的进步,互联网的发展关系型数据库已经不满足于互联网的需求,因此出现了非关系数据库,下面这篇文章主要给大家总结介绍了关于MongoDB数据库常用28条查询语句,需要的朋友可以参考下
    2023-05-05
  • MongoDB的chunk详解

    MongoDB的chunk详解

    这篇文章主要介绍了MongoDB的chunk的相关资料,帮助大家更好的理解和学习使用MongoDB数据库,感兴趣的朋友可以了解下
    2021-04-04
  • mongodb 修改器($inc/$set/$unset/$push/$pop/upsert)

    mongodb 修改器($inc/$set/$unset/$push/$pop/upsert)

    对于文档的更新除替换外,针对某个或多个文档只需要部分更新可使用原子的更新修改器,能够高效的进行文档更新。更新修改器是中特殊的键
    2017-04-04
  • mongodb 3.2.5安装详细过程

    mongodb 3.2.5安装详细过程

    这篇文章主要介绍了mongodb 3.2.5安装过程详细记录,本文分步骤给大家介绍的非常详细,具有一定的参考借鉴价值,感兴趣的朋友一起看看吧
    2016-10-10
  • MongoDB条件操作符的具体使用

    MongoDB条件操作符的具体使用

    MongoDB的条件操作符主要分为比较操作符、逻辑操作符、元素操作符、数组操作符、文本搜索操作符等几种类型,本文就详细的介绍一下这几种类型的操作,具有一定的参考价值,感兴趣的可以了解一下
    2023-12-12
  • MongoDB 数据库的命名、设计规范详解

    MongoDB 数据库的命名、设计规范详解

    随着MongoDB的普及和使用量的快速增长,为了规范使用,便于管理和获取更高的性能,整理此文档
    2020-02-02

最新评论