Pytest中使用SQLAlchemy进行异步数据库测试过程

 更新时间:2025年12月30日 08:39:01   作者:nvd11  
本文详细介绍了在pytest环境下使用SQLAlchemy的异步功能来管理数据库连接和状态,通过不同的scope参数控制fixture的生命周期,确保测试的隔离性和可靠性,主要介绍了两种测试隔离策略:每次重建和事务回滚

本文档详细解释了在 pytest 环境下,如何使用 SQLAlchemy 的异步功能来管理数据库连接和状态,以确保测试的隔离性和可靠性。

1. Pytest Fixture 核心概念:作用域 (Scope)

@pytest.fixturepytest 中一个非常强大的功能,它用于为测试函数提供数据、对象或预备/清理环境。其中,scope 参数是控制 fixture生命周期的关键。

scope 参数决定了一个 fixture 实例会被创建和销毁的频率。它有以下几个选项,按从小到大的顺序排列:

Scope描述适用场景
function (默认)每个测试函数运行一次。这是最高级别的隔离性。数据库事务、独立的测试数据、需要重置状态的 mock 对象。
class每个测试类只运行一次。针对某个类的所有方法共享的、较昂贵的资源。
module每个测试文件 (.py) 只运行一次。整个文件中的所有测试共享的、创建开销很大的资源(如数据库连接池)。
package每个测试包 (目录) 只运行一次。整个包中的所有测试共享的资源。
session整个测试会话 (即一次 pytest 命令的运行) 只运行一次。全局配置、整个测试过程只需建立一次的连接(如数据库引擎)。

在我们的数据库测试策略中,我们组合使用了不同的 scope

  • db_engine 使用 scope="module": 因为数据库引擎的创建开销较大,我们希望在一个测试文件中它只被创建一次。
  • db_session 使用 scope="function": 因为我们希望每个测试函数都在一个独立的、干净的事务中运行,测试结束后立即回滚,互不干扰。

2. 核心概念:MetaData 对象

MetaData 对象可以被看作是您数据库 schema 在 Python 代码中的一个“注册表”或“目录”。

它是一个容器,用于存放所有与它关联的 Table 对象的定义。

在我们的项目中,src/models/tables.py 中定义的所有 Table 对象都注册到了一个全局的 metadata 实例上。

这使得我们可以执行强大的 schema 级别的操作,如 metadata.create_all()metadata.drop_all()

2. 测试隔离策略

为了确保每个单元测试都在一个独立、干净的环境中运行,不受其他测试的影响,我们需要实现一种“测试隔离”策略。主要有两种方法:

策略一:每次重建 (Recreation per Test) - 我们当前使用的方法

这是最直观、最健壮的方法,不依赖特定数据库的事务特性。

示例代码

# test/dao/test_user_dao.py
@pytest.mark.asyncio
async def test_create_user():
    # 1. 为此测试创建独立的引擎
    engine = create_async_engine(DATABASE_URL)
    
    # 2. 在测试开始时,物理删除并重建所有表
    async with engine.begin() as conn:
        await conn.run_sync(metadata.drop_all)
        await conn.run_sync(metadata.create_all)

    # 3. 执行测试逻辑 (包括 commit)
    async with AsyncSession(engine) as session:
        # ... DAO 调用 ...
    
    # 4. 在测试结束时,销毁引擎以关闭所有物理连接
    await engine.dispose()

关键点解析

metadata.drop_all() / create_all():

  • 作用: 实现测试隔离。
  • 原理: 在每个测试函数开始时,物理地删除并重新创建所有数据库表。这保证了每个测试面对的都是一个全新的、空的数据库。
  • DDL 与事务: 您提出了一个很好的问题:DROP/CREATE 是 DDL,为何要放在 engine.begin() 事务块中?在 PostgreSQL 中,DDL 是事务性的,可以被包含在事务中。但在这里,使用 engine.begin() 的主要目的是为了优雅地管理连接的生命周期(获取连接、执行操作、释放连接),而不是为了 DDL 的原子性。

engine.dispose():

  • 作用: 实现资源清理。
  • 原理: 关闭并销毁 engine 内部维护的整个连接池中的所有物理数据库连接。

rollback 的区别: dispose() 不会回滚任何已提交的事务。它只负责关闭网络连接。在我们的例子中,测试数据的清理是由下一个测试开始时的 drop_all 完成的。

  • 优点: 极其可靠,跨数据库兼容性好。

  • 缺点: 性能较低。对于每个测试都删除和创建表,开销很大。

策略二:事务回滚 (Transaction Rollback) - 更高效的策略

这是一种更高级、性能更好的方法,它利用了数据库的事务特性。

理论代码

# conftest.py - (这是一个理论上的例子,我们当前项目没有使用)

@pytest.fixture(scope="session")
async def engine():
    # 整个测试会话只创建一个引擎
    db_engine = create_async_engine(DATABASE_URL)
    yield db_engine
    await db_engine.dispose()

@pytest.fixture(scope="session", autouse=True)
async def setup_database(engine):
    # 在会话开始时创建一次表,结束时删除一次
    async with engine.begin() as conn:
        await conn.run_sync(metadata.create_all)
    yield
    async with engine.begin() as conn:
        await conn.run_sync(metadata.drop_all)

@pytest.fixture(scope="function")
async def db_session(engine) -> AsyncSession:
    # 为每个测试函数提供一个特殊的“回滚”会话
    async with engine.connect() as connection:
        async with connection.begin() as transaction: # 开始一个事务
            async with AsyncSession(bind=connection) as session:
                yield session
                # 测试结束后,回滚这个事务,撤销所有 DML 操作
                await transaction.rollback()

关键点解析

setup_database Fixture: 在整个测试会话开始时创建一次所有表,在会话结束时删除它们。

db_session Fixture:

  • connection.begin(): 在每个测试函数开始时,它会启动一个事务(或者在支持的数据库上是一个嵌套事务/保存点)。
  • yield session: 测试函数在自己的这个“子事务”中运行,可以自由地 COMMIT 数据。
  • await transaction.rollback(): 这是核心。当测试函数结束时,无论测试成功与否,也无论函数内部是否执行了 commit,这个 fixture 都会强制回滚最外层的事务。

效果: test_create_userCOMMIT 的数据实际上只被提交到了一个未关闭的事务中。测试一结束,整个事务就被回滚,数据库瞬间恢复到测试开始前的状态。

  • 优点: 速度极快ROLLBACK 是一个非常轻量级的操作。
  • 缺点: 实现更复杂,且依赖于数据库对事务性 DDL 的支持。

总结

我们当前采用的**策略一(每次重建)**虽然性能稍低,但它更简单、直观,并且能 100% 保证每个测试的隔离性。对于大多数项目来说,这都是一个非常可靠和推荐的起点。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • django admin 后台实现三级联动的示例代码

    django admin 后台实现三级联动的示例代码

    这篇文章主要介绍了django admin 后台实现三级联动的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06
  • 教你怎么用Python实现GIF动图的提取及合成

    教你怎么用Python实现GIF动图的提取及合成

    今天教大家一个Python有趣好玩的小功能:将多张图片转为GIF,同时也可以将一个GIF动图提取出里面的图片,文中有非常详细的介绍及代码示例,需要的朋友可以参考下
    2021-06-06
  • Python中re.compile函数的使用方法

    Python中re.compile函数的使用方法

    这篇文章主要介绍在python的re模块中怎样应用正则表达式,文中有相关的代码示例,具有一定的参考价值,需要的朋友可以参考下
    2023-06-06
  • Python中logging模块的用法实例

    Python中logging模块的用法实例

    这篇文章主要介绍了Python中logging模块的用法实例,以实例形式介绍了日志模块logging的用法,具有一定的实用价值,需要的朋友可以参考下
    2014-09-09
  • python3中calendar返回某一时间点实例讲解

    python3中calendar返回某一时间点实例讲解

    在本篇内容里小编给大家整理了关于python3中calendar返回某一时间点实例讲解内容,有兴趣的朋友们可以参考学习下。
    2020-11-11
  • Python嵌套循环的使用

    Python嵌套循环的使用

    本文主要介绍了Python嵌套循环的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧<BR>
    2023-02-02
  • 使用PyGame显示图像的四种方案实例代码

    使用PyGame显示图像的四种方案实例代码

    由于前面学习了使用pygame的简单操作,现在学习当前的pygame怎么加载图片,下面这篇文章主要给大家介绍了关于使用PyGame显示图像的四种方案,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-12-12
  • 对pandas通过索引提取dataframe的行方法详解

    对pandas通过索引提取dataframe的行方法详解

    今天小编就为大家分享一篇对pandas通过索引提取dataframe的行方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • Python数据清理技巧分享

    Python数据清理技巧分享

    数据常常被比作新时代的石油,就像石油需要经过提炼才能制造出汽油一样,数据也需要经过整理才能发挥其作用,Python作为最广泛使用的编程语言之一,提供了强大的数据整理工具,本文给大家介绍了Python数据清理的技巧,需要的朋友可以参考下
    2023-10-10
  • Python边缘检测之prewitt,sobel和laplace算子详解

    Python边缘检测之prewitt,sobel和laplace算子详解

    这篇文章主要为大家详细介绍了Python边缘检测中prewitt、sobel和laplace算子的使用方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-04-04

最新评论