MongoDB学习笔记之MapReduce使用示例

 更新时间:2015年07月04日 15:31:26   转载 投稿:junjie  
这篇文章主要介绍了MongoDB学习笔记之MapReduce使用示例,本文直接给出实例代码,需要的朋友可以参考下

一、mapreduce是根据map函数里调用的emit函数的第一个参数来进行分组的

Map-Reduce是一种计算模型,简单的说就是将大批量的工作(数据)分解(MAP)执行,然后再将结果合并成最终结果(REDUCE)。

使用 MapReduce 要实现两个函数 Map 函数和 Reduce 函数, Map 函数调用 emit(key, value), 遍历 collection 中所有的记录, 将key 与 value 传递给 Reduce 函数进行处理。Map 函数必须调用 emit(key, value) 返回键值对。

参数说明:
1. map :映射函数 (生成键值对序列,作为 reduce 函数参数)。
2. reduce 统计函数,reduce函数的任务就是将key- values变成key-value,也就是把values数组变成一个单一的值value。
3. out 统计结果存放集合 (不指定则使用临时集合,在客户端断开后自动删除)。
4. query 一个筛选条件,只有满足条件的文档才会调用map函数。(query。limit,sort可以随意组合)
5. sort 和limit结合的sort排序参数(也是在发往map函数前给文档排序),可以优化分组机制
6. limit 发往map函数的文档数量的上限(要是没有limit,单独使用sort的用处不大)

//测试数据准备
db.user.drop();

for(var i=10; i< 100; i++) {
  db.user.insert({
    name:"user" + i, 
    age : Math.floor(Math.random()*10)+ 20, 
    sex : Math.floor(Math.random()*3)%2 ==0 ? 'M' : 'F',
    chinese : Math.floor(Math.random()*50)+50,
    math : Math.floor(Math.random()*50)+50,
    english : Math.floor(Math.random()*50)+50,
    class : "C" + i%5
  })
}


// runCommand运行方式
db.sales.runCommand({
  mapreduce: "user",

  map: function(){
    if(this.class == "C1") {
      emit(this.age, this.age);
    }
  },

  reduce: function(key,values){
    var maxValue = Max(key, values);
    return maxValue;
  },

  {
    out: {inline: 1},
    query : "",
    sort: "",
    limit: "",
  }
})


db.user.mapReduce(
  // 映射函数,里面会调用emit(key,value),集合会按照你指定的key进行映射分组。
  function(){
    // 按照emit函数的第一个参数进行分组
    // 第二个参数的值会传递给reduce
    emit(this.age, this);  
  },

  // 简化函数,会对map分组后的数据进行分组简化
  // 在reduce(key,value)中的key就是emit中的key, vlaues为emit分组后的emit(value)的集合
  function(key, values){
    var maxValue = Math.max(key, values);
    return maxValue;
  },

  // 可选参数
  {
    query: {sex: "F"},
    out: "result",
    sort : {},
    limit : 0
  }
)

执行结果:

{
  "result" : "result", // 存放的集合名
  "timeMillis" : 23,
  "counts" : {
    "input" : 29, // 传入文档的个数
    "emit" : 29,  // 此函数被调用的次数
    "reduce" : 6, // 此函数被调用的次数
    "output" : 8  // 最后返回文档的个数
  },
  "ok" : 1
}

查看返回的结果:

db.result.find()

相关文章

  • MongoDB实现基于关键词的文章检索功能(C#版)

    MongoDB实现基于关键词的文章检索功能(C#版)

    这篇文章主要介绍了MongoDB实现基于关键词的文章检索功能(C#版)的相关资料,需要的朋友可以参考下
    2016-04-04
  • 详解MongoDB数据还原及同步解决思路

    详解MongoDB数据还原及同步解决思路

    mongodb数据如何还原,同步到其他系统?其实实现方法很简单,这篇文章主要介绍了MongoDB数据还原及同步解决思路,需要的朋友可以参考下
    2018-08-08
  • MongoDB TTL索引的实例详解

    MongoDB TTL索引的实例详解

    这篇文章主要介绍了 MongoDB TTL索引的实例详解的相关资料,希望通过本文能帮助到大家,让大家理解掌握这部分内容,需要的朋友可以参考下
    2017-10-10
  • MongoDB使用自带的命令行工具进行备份和恢复的教程

    MongoDB使用自带的命令行工具进行备份和恢复的教程

    这篇文章主要介绍了MongoDB使用自带的命令行工具进行备份和恢复的教程,我们只需要在命令行界面中用简单的命令操作mongorestore和mongodump工具就可以实现,需要的朋友可以参考下
    2016-06-06
  • MongoDB运行日志实现自动分割的方法实例

    MongoDB运行日志实现自动分割的方法实例

    这篇文章主要给大家介绍了关于MongoDB运行日志实现自动分割的方法,文中以一个MongoDB实例为例,写了一个脚本来实现自动分割MongoDB日志,有需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-01-01
  • Mongodb 数据类型及Mongoose常用CURD

    Mongodb 数据类型及Mongoose常用CURD

    MongoDB 是一个开源的 NoSQL 数据库,相比 MySQL 那样的关系型数据库,它更为轻巧、灵活,非常适合在数据规模很大、事务性不强的场合下使用,本文给大家介绍Mongodb 数据类型及Mongoose常用CURD,感兴趣的朋友一起学习吧
    2016-01-01
  • Centos 7下Mongodb开机无法自启动的解决方法

    Centos 7下Mongodb开机无法自启动的解决方法

    这篇文章主要介绍了Centos 7下Mongodb开机无法自启动的解决方法,文中介绍的非常详细,对大家具有一定的参考价值,需要的朋友们下面来一起看看吧。
    2017-03-03
  • MongoDB系列教程(五):mongo语法和mysql语法对比学习

    MongoDB系列教程(五):mongo语法和mysql语法对比学习

    这篇文章主要介绍了MongoDB系列教程(五):mongo语法和mysql语法对比学习,本文对熟悉Mysql数据库的同学来说帮助很大,用对比的方式可以快速学习到MongoDB的命令,需要的朋友可以参考下
    2015-05-05
  • Windows系统安装运行Mongodb服务

    Windows系统安装运行Mongodb服务

    今天小编就为大家分享一篇关于Windows系统安装运行Mongodb服务,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10
  • MongoDB设计方法以及技巧示例详解

    MongoDB设计方法以及技巧示例详解

    这篇文章主要给大家介绍了关于MongoDB设计方法以及技巧的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用MongoDB具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2020-06-06

最新评论