python-pymongo常用查询方法含聚合问题

 更新时间:2023年05月08日 09:28:48   作者:L'y  
这篇文章主要介绍了python-pymongo常用查询方法含聚合问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

普通查询

按照所需字段排序

db_set.find().sort("field_name ",pymongo.ASCENDING) --升序
db_set.find().sort("field_name ",pymongo.DESCENDING) --降序

查询数据库表的全部内容

# 第一种:
 db_set.find({})
#第二种:
db_set.find()

精确查询

db_set.find({“field_name”:”value”})
db_set.find({“field_name”:”value”, “field_name”:”value”})

只返回所需要的字段信息

find的第二参数可以帮助我们只把需要的键值信息返回,需要将我们需要的键指定为1,另外默认的”_id”默认是返回的,我们不需要它返回的话将它的值设为0

db_set.find({}, {“field_name_one”:1, “field_name_two”:1,”_id”:0})

比较查询

首先 $lt和<,$lte和<=,$gt和>,gte和>=,ne和!=是一一对应的

db_set.find({"field_name": {"$lt": value, "$gt": value}})

关联查询

如果只想查询一个键的多个值,或取除某个值之外所有的数据那么就用到了, $in和$nin

#比如我只想获取field_name为1,5,8的数据:
db_set.find({"field_name": {"$in": [1,5,8]}})
#如果想获取field_name为5之外的所有数据:
db_set.find({"field_name": {"$nin": [5]}})

多条件模糊查询

$regex为模糊查询的字符串提供正则表达式功能

db_set.find({"$or": [{"field_name": {'$regex': value}},{"field_name": {'$regex': value}}]})

聚合

语法格式:db.集合名称.aggregate([{管道:{表达式}}])

list_a = list(ROLE_TREE.aggregate([
    {"$group":
        {
            "_id": '$update_time',  # 我想查询的字段
            "counter": {"$sum": 1}  # 产生的数量
        }
    }
]))
print(list_a)
res= [{'_id': 1649238526, 'counter': 1}, {'_id': 1649405332, 'counter': 1}, {'_id': 1649405568, 'counter': 1}, {'_id': 1649237591, 'counter': 1}, {'_id': 1649237314, 'counter': 1}, {'_id': 1649405347, 'counter': 1}]

常用管道

  • $group:将集合中的文档分组,可用于统计结果
  • $match:过滤数据,只输出符合条件的文档
  • $project:修改输入文档的结构,如重命名、增加、删除字段、创建计算结果
  • $sort:将输入文档排序后输出
  • $limit:限制聚合管道返回的文档数
  • $skip:跳过指定数量的文档,并返回余下的文档

常用表达式

  • $sum:计算总和,$sum:1同count表示计数
  • $avg:计算平均值
  • $min:获取最小值
  • $max:获取最大值
  • $push:在结果文档中插入值到一个数组中
  • $first:根据资源文档的排序获取第一个文档数据
  • $last:根据资源文档的排序获取最后一个文档数据

$group

将集合中的文档分组,可用于统计结果 ,_id表示分组的依据,使用某个字段的格式为’$字段’

list(ROLE_TREE.aggregate([
    {"$group":
        {
            "_id": '$update_time',  # 我想查询的字段
            "counter": {"$sum": 1}  # 产生的数量
        }
    }
]))
# "counter"为自定义名称,用来存储结果的变量

Group by null:将集合中所有文档分为一组

list_a = list(ROLE_TREE.aggregate([
    {"$group":
        {
            "_id": None,  # 为空
            "counter": {"$sum": 1}  # 产生的数量
        }
    }
]))
res = [{'_id': None, 'counter': 6}]

$match

用于过滤数据,只输出符合条件的文档,使用MongoDB的标准查询操作

list_a = list(ROLE_TREE.aggregate([
    {'$match': {'update_time': {'$lt': int(time.time())}}}, # 查找
    {'$group': {'_id': '$update_time', 'counter': {'$sum': 1}}} # 分组
]))
res= [{'_id': 1649405332, 'counter': 1}, {'_id': 1649405347, 'counter': 1}, {'_id': 1649237314, 'counter': 1}, {'_id': 1649237591, 'counter': 1}, {'_id': 1649405568, 'counter': 1}, {'_id': 1649238526, 'counter': 1}]
# ---------------------------------
list_a = list(ROLE_TREE.aggregate([
    {'$match': {'update_time': int(time.time())}},  # 查找
    # {'$group': {'_id': '$update_time', 'counter': {'$sum': 1}}} # 分组
]))
res = []

$project

修改输入文档的结构,如重命名、增加、删除字段、创建计算结果(类似查找中投影,值为1表示显示,值为0不显示)

list_a = list(ROLE_TREE.aggregate([
    {"$project": {"_id": 1, "create_time": 1, 'org_id': 1}},  # _id  一定在前
    {'$group': {'_id': '$create_time', 'counter': {'$sum': 1}}}  # 分组
]))
res = [{'_id': 1649237314, 'counter': 1}, {'_id': 1649405347, 'counter': 1}, {'_id': 1649405568, 'counter': 1}, {'_id': 1649238526, 'counter': 1}, {'_id': 1649405332, 'counter': 1}, {'_id': 1649237591, 'counter': 1}]

$sort

将输入文档排序后输出 ,1 升序 -1降序

list_a = list(ROLE_TREE.aggregate([
    {'$sort': {'update_time': 1}},
    {"$project": {"_id": 0, 'update_time': 1}}
]))
res = [{'update_time': 1649237314}, {'update_time': 1649237591}, {'update_time': 1649238526}, {'update_time': 1649405332}, {'update_time': 1649405347}, {'update_time': 1649405568}]

$limit

限制聚合管道返回的文档数

list_a = list(ROLE_TREE.aggregate([
    {"$limit": 2},
    {"$project": {'_id': 1}}
]))
res=  [{'_id': '8796e0d2a75ee0d84c1fbcb5ac4e7cc5'}, {'_id': 'bbd7664aa4b1d7fbfaa0256b05a78fd1'}]

$skip

跳过指定数量的文档,并返回余下的文档

list_a = list(ROLE_TREE.aggregate([
    {"$skip": 3},  # 跳过
    {"$project": {'_id': 1}}
]))
res = [{'_id': '26702db7682ef817047b9681cd685987'}, {'_id': 'b64f271c735c8a57b34a0feefd292d65'}, {'_id': '5974aaaf7848fd8af6426cad375c4b62'}]

先写skip,再写limit

list_a = list(ROLE_TREE.aggregate([
    {"$skip": 1},  # 跳过
    {"$limit": 1},  # 分组数量
    {"$project": {'_id': 1}}
]))
res = [{'_id': 'bbd7664aa4b1d7fbfaa0256b05a78fd1'}]

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python利用线程实现多任务

    python利用线程实现多任务

    这篇文章主要介绍了python利用线程实现多任务,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-09-09
  • python爬取亚马逊书籍信息代码分享

    python爬取亚马逊书籍信息代码分享

    这篇文章主要介绍了python爬取亚马逊书籍信息代码分享,具有一定借鉴价值,需要的朋友可以参考下。
    2017-12-12
  • Python 网络编程起步(Socket发送消息)

    Python 网络编程起步(Socket发送消息)

    现在开始学习网络编程,先从简单的UDP协议发送消息开始。我们需要有接受消息的服务端程序(Server.py)和发送消息的客户端程序(Client)。
    2008-09-09
  • 如何基于Python代码实现高精度免费OCR工具

    如何基于Python代码实现高精度免费OCR工具

    这篇文章主要介绍了如何基于Python代码实现高精度免费OCR工具,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • 5个Python使用F-String进行格式化的实用技巧分享

    5个Python使用F-String进行格式化的实用技巧分享

    F-String(格式化字符串字面值)是在Python 3.6中引入的,它是一种非常强大且灵活的字符串格式化方法,本文总结了5个实用的F-String技巧,相信一定能让你的代码输出更加的美观,快跟随小编一起学习起来吧
    2024-03-03
  • 浅析Python四种数据类型

    浅析Python四种数据类型

    在这篇文章里,我们给大家分享了关于Python的四种数据类型相关知识点内容,有兴趣的朋友们参考下。
    2018-09-09
  • 基于Python实现个人手机定位分析

    基于Python实现个人手机定位分析

    TransBigData是一个为交通时空大数据处理、分析和可视化而开发的Python包。本文就来用它实现个人手机定位分析,感兴趣的小伙伴可以了解一下
    2023-04-04
  • 完美解决python3.7 pip升级 拒绝访问问题

    完美解决python3.7 pip升级 拒绝访问问题

    这篇文章主要介绍了python3.7 pip升级 拒绝访问 解决方案,文中给大家提到了python中for循环问题,本文给大家介绍的非常详细,具有一定的参考借鉴价值 ,需要的朋友可以参考下
    2019-07-07
  • Python从零开始创建区块链

    Python从零开始创建区块链

    这篇文章主要为大家详细介绍了Python从零开始创建区块链的步骤 ,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • python pygame实现2048游戏

    python pygame实现2048游戏

    这篇文章主要为大家详细介绍了python pygame实现2048游戏,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-11-11

最新评论