Python使用Tenacity一行代码实现自动重试详解

 更新时间:2025年08月01日 15:34:50   作者:mortimer  
tenacity 是一个专为 Python 设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看看如何一行代码实现自动重试吧

在与AI大模型API服务交互时,我们总会面对一个无法回避的现实:网络并不总是可靠。代理可能中断,API会限制请求频率,连接可能超时,甚至网络会短暂中断。幸运的是,这些问题通常是暂时的。如果第一次请求失败,稍等片刻再试一次,往往就能成功。

这种“再试一次”的策略,就是重试。它不是什么高深的技术,却是构建可靠、健壮应用程序的关键一环。

一切始于一个简单的 API 调用

让我们从一个真实场景开始:调用 AI 模型的 API 来完成字幕翻译。一段基础的代码可能长这样:

# 一个基本的 API 调用函数
from openai import OpenAI, APIConnectionError

def translate_text(text: str) -> str:
    message = [
        {'role': 'system', 'content': '您是一名顶级的字幕翻译引擎。'},
        {'role': 'user', 'content': f'<INPUT>{text}</INPUT>'},
    ]
    model = OpenAI(api_key="YOUR_API_KEY", base_url="...") 

    try:
        response = model.chat.completions.create(model="gpt-4o", messages=message)
        if response.choices:
            return response.choices[0].message.content.strip()
        raise RuntimeError("API未返回有效结果")
    except APIConnectionError as e:
        print(f"网络连接失败: {e}。需要重试...")
        raise # 程序在这里崩溃
    except Exception as e:
        print(f"发生其他错误: {e}")
        raise

这段代码能工作,但它很“脆弱”。一旦遇到网络问题,它只会打印一条消息然后崩溃。我们当然可以手动写一个 for 循环和 time.sleep 来实现重试:

# 手动实现重试
for attempt in range(3):
    try:
        # ... API 调用逻辑 ...
        return response.choices[0].message.content.strip()
    except APIConnectionError as e:
        print(f"第 {attempt + 1} 次尝试失败: {e}")
        if attempt == 2: # 检查是否是最后一次尝试
            raise
    # ... 对其他异常也要重复写相似的逻辑 ...

这种方式很快就会让代码变得复杂和混乱。重试逻辑和业务逻辑混杂在一起,而且如果我们需要在多个地方重试,就不得不编写大量重复、易错的代码。

这时,tenacity 库就派上用场了。

Tenacity 入门:一行代码实现优雅重试

tenacity 是一个专为 Python 设计的通用重试库。它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力。

安装:pip install tenacity

我们可以用 @retry 装饰器轻松改造上面的函数:

from tenacity import retry

@retry
def translate_text(text: str) -> str:
    # ... 内部逻辑和之前完全一样,无需任何改动 ...

仅仅加了一行 @retry,这个函数就焕然一新。现在,如果 translate_text 函数内部抛出任何异常,tenacity 都会自动捕获它,并立即重新调用该函数。它会一直重试,永不停止,直到函数成功返回一个值。

精细控制:让重试按我们的意愿行事

“永远重试”通常不是我们想要的。我们需要设定一些边界。tenacity 提供了丰富的参数来实现精细的控制。

1. 设置停止条件 (stop)

我们不希望无限次地重试。最常见的需求是“最多尝试 N 次”,这可以通过 stop_after_attempt 实现。

from tenacity import retry, stop_after_attempt

# 总共尝试 3 次
@retry(stop=stop_after_attempt(3))
def translate_text(text: str) -> str:
    # ...

注意:一个重要的认知细节 stop_after_attempt(N) 指的是总共的尝试次数,而不是“重试次数”。

  • stop_after_attempt(1) 意味着:执行 1 次,如果失败,立即停止。它根本不会重试。
  • stop_after_attempt(3) 意味着:总共执行 3 次,即首次尝试 + 2 次重试

记住这个简单的规则:如果你希望在失败后能额外重试 Y 次,那么你应该设置 stop_after_attempt(Y + 1)

我们也可以按时间来限制,比如 stop_after_delay(10) 表示“10秒后停止”。更棒的是,你可以用 | (或) 操作符将它们组合起来,哪个条件先满足就停止。

from tenacity import stop_after_delay

# 总次数达到 5 次或总耗时超过 30 秒,就停止
@retry(stop=(stop_after_attempt(5) | stop_after_delay(30)))
def translate_text(text: str) -> str:
    # ...

2. 设置等待策略 (wait)

连续不断地快速重试可能会压垮服务器或达到频率限制。在两次重试之间加入等待是明智之举。最简单的是固定等待,使用 wait_fixed

from tenacity import retry, wait_fixed

# 每次重试前都等待 2 秒
@retry(wait=wait_fixed(2))
def translate_text(text: str) -> str:
    # ...

在与网络服务交互时,更推荐指数退避 (wait_exponential)。它会随着重试次数的增加,逐渐拉长等待时间(比如 2s, 4s, 8s...),能有效避免在服务高峰期造成“重试风暴”。

from tenacity import wait_exponential

# 首次重试等 2^1=2s, 之后等 4s, 8s... 最多等到 10s
@retry(wait=wait_exponential(multiplier=1, min=2, max=10))
def translate_text(text: str) -> str:
    # ...

3. 决定何时重试 (retry)

默认情况下,tenacity 会在遇到任何异常时都进行重试。但这并不总是对的。

比如,APIConnectionError (网络问题) 或 RateLimitError (请求太频繁) 是典型的可恢复错误,重试很有可能会成功。但 AuthenticationError (密钥错误) 或 PermissionDeniedError (无权限) 则是致命错误,重试多少次都注定失败。

我们可以通过 retry_if_not_exception_type 来告诉 tenacity 遇到某些致命错误时不要重试。

注意:一个常见的语法陷阱 当指定多个异常类型时,你可能会直觉地写成 AuthenticationError | PermissionDeniedError

# 错误的方式!这无法按预期工作
@retry(retry=retry_if_not_exception_type(AuthenticationError | PermissionDeniedError))

在现代 Python 中,A | B 创建的是一个 UnionType 对象,而 tenacity 的这个函数期望接收一个包含异常类型的元组 (tuple)

正确的写法是:

from openai import AuthenticationError, PermissionDeniedError

# 正确的方式!使用元组
@retry(retry=retry_if_not_exception_type((AuthenticationError, PermissionDeniedError)))

这个小小的括号,至关重要。

当重试最终失败时

如果 tenacity 在用尽所有尝试后依然失败,它会怎么做?默认情况下,它会抛出一个 RetryError,其中包含了最后一次失败时的原始异常。

但有时我们不希望程序崩溃,而是想执行一些自定义的收尾工作,比如记录一条详细的错误日志,并返回一个友好的错误提示。这就是 retry_error_callback 的用武之地。

from tenacity import RetryCallState

def my_error_callback(retry_state: RetryCallState):
    # retry_state 对象包含了这次重试的所有信息
    print(f"所有 {retry_state.attempt_number} 次尝试均失败!")
    return "默认的翻译结果或错误提示"

@retry(stop=stop_after_attempt(3), retry_error_callback=my_error_callback)
def translate_text(text: str) -> str:
    # ...

现在,如果函数连续失败 3 次,它不会抛出异常,而是会返回 my_error_callback 函数的返回值。

注意:回调函数里的一个微妙陷阱 在回调函数中,我们如何安全地获取最后一次的异常信息?

def return_last_value(retry_state: RetryCallState):
    # 危险!这会重新抛出异常!
    return "失败:" + retry_state.outcome.result()

retry_state.outcome 代表了最后一次尝试的结果。如果那次尝试是失败的,调用 .result() 方法会重新抛出那个异常,导致我们的回调函数自身崩溃。

正确的做法是使用 .exception() 方法,它会安全地返回异常对象,而不会抛出它:

def return_last_value(retry_state: RetryCallState):
    # 安全!这只会返回异常对象
    last_exception = retry_state.outcome.exception()
    return f"经过 {retry_state.attempt_number} 次尝试后失败。最后一次错误是: {last_exception}"

当 Tenacity 遇到面向对象

随着代码库的增长,我们通常会把逻辑封装在类里。这时,我们会遇到两个更深层次的问题:作用域继承

1. 回调函数如何访问 self

假设我们的回调函数需要访问类的实例变量(比如 self.name)。我们可能会很自然地这样写:

class TTS:
    def __init__(self, name):
        self.name = name

    def _my_callback(self, retry_state):
        print(f"实例 {self.name} 的任务失败了。")
        # ...

    # 这会失败!NameError: name 'self' is not defined
    @retry(retry_error_callback=self._my_callback)
    def run(self):
        # ...

这会立即报错,因为 @retry 装饰器是在定义类的时候执行的,那时还没有任何类的实例,自然也就没有 self

最优雅的解决方案是**“内部函数闭包”**模式。我们将装饰器应用在一个定义于实例方法内部的函数上:

class TTS:
    def __init__(self, name):
        self.name = name

    def run(self):
        # 在这里,self 是可用的!
        @retry(
            # 因为装饰器在 run 方法内部,它可以“捕获”到 self
            retry_error_callback=self._my_callback
        )
        def _execute_task():
            # 这里是真正需要重试的逻辑
            print(f"正在为 {self.name} 执行任务...")
            raise ValueError("任务失败")

        # 调用被装饰的内部函数
        return _execute_task()

    def _my_callback(self, retry_state: RetryCallState):
        # ...

这是一种非常强大且 Pythonic 的模式,完美解决了作用域问题。

2. 如何在父类中定义重试策略,让所有子类继承

这是我们讨论的最后一个,也是最体现设计思想的问题。假设我们有一个 BaseProvider 父类,和多个 MyProviderA, MyProviderB 子类。我们希望所有子类都遵循统一的重试规则。

一个常见的错误想法是在父类的空方法上应用装饰器。当子类重写该方法时,父类上的装饰器也随之丢失。

正确的解决方案是模板方法设计模式 (Template Method Pattern)

  • 父类定义一个模板方法 (_exec),它包含了不可变的算法框架(即我们的重试逻辑)。
  • 这个模板方法会调用一个抽象的钩子方法 (_do_work)。
  • 子类只需要实现这个钩子方法,填充具体的业务逻辑即可。

让我们用一个更完整的例子来构建这个模式:

from openai import OpenAI, AuthenticationError, PermissionDeniedError
from tenacity import retry, stop_after_attempt, wait_fixed, retry_if_not_exception_type, RetryCallState

# 1. 定义一个通用的、可复用的异常处理类
class RetryRaise:
    # 定义不应重试的致命异常
    NO_RETRY_EXCEPT = (AuthenticationError, PermissionDeniedError)

    @classmethod
    def _raise(cls, retry_state: RetryCallState):
        ex = retry_state.outcome.exception()
        if ex:
            # 根据不同异常类型,进行日志记录并抛出自定义的、更友好的 RuntimeError
            # ... 此处可以添加更复杂的异常分类逻辑 ...
            raise RuntimeError(f"重试 {retry_state.attempt_number} 次后最终失败: {ex}") from ex
        raise RuntimeError(f"重试 {retry_state.attempt_number} 次后失败,但未捕获到异常。")

# 2. 实现模板父类
class BaseProvider:
    @retry(
        stop=stop_after_attempt(3),
        wait=wait_fixed(2),
        retry=retry_if_not_exception_type(RetryRaise.NO_RETRY_EXCEPT),
        retry_error_callback=RetryRaise._raise
    )
    def _exec(self) -> str:
        """这是模板方法,负责重试。子类不应重写它。"""
        # 调用钩子方法,由子类实现
        return self._do_work()

    def _do_work(self) -> str:
        """这是钩子方法,子类必须实现它。"""
        raise NotImplementedError("子类必须实现 _do_work 方法")

# 3. 实现具体的子类
class DeepSeekProvider(BaseProvider):
    def __init__(self, api_key: str, base_url: str):
        self.api_key = api_key
        self.base_url = base_url
        self.model = OpenAI(api_key=self.api_key, base_url=self.base_url)

    def _do_work(self) -> str:
        """这里只关心核心业务逻辑,完全不用考虑重试。"""
        response = self.model.chat.completions.create(
            model="deepseek-chat",
            messages=[{'role': 'user', 'content': '你是谁?'}]
        )
        if response.choices:
            return response.choices[0].message.content.strip()
        raise RuntimeError(f"API未返回有效结果: {response}")

# --- 如何使用 ---
 provider = DeepSeekProvider(api_key="...", base_url="...")
 try:
     # 我们调用的是 _exec,它包含了重试逻辑
     result = provider._exec()
     print("执行成功:", result)
 except RuntimeError as e:
     # 如果最终失败,会捕获到 RetryRaise 抛出的友好异常
     print("执行失败:", e)

通过这种方式,我们将重试策略(不变的部分)和业务逻辑(可变的部分)完美地分离开来,构建了一个既健壮又易于扩展的框架。

tenacity 是一个看似简单,实则功能强大的库。它不仅能轻松应对简单的重试场景,更能通过巧妙的设计模式,解决复杂的、面向对象的应用程序中的可靠性问题。

到此这篇关于Python使用Tenacity一行代码实现自动重试详解的文章就介绍到这了,更多相关Python Tenacity自动重试内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • pytorch 如何使用batch训练lstm网络

    pytorch 如何使用batch训练lstm网络

    这篇文章主要介绍了pytorch 如何使用batch训练lstm网络的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • python关于变量名的基础知识点

    python关于变量名的基础知识点

    在本篇文章里小编给大家整理的是关于python关于变量名的基础知识点,需要的朋友们可以参考下。
    2020-03-03
  • Python单例模式实例分析

    Python单例模式实例分析

    这篇文章主要介绍了Python单例模式,以实例形式分析了Python单例模式的具体使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-01-01
  • Python如何在类中定义装饰器

    Python如何在类中定义装饰器

    这篇文章主要介绍了Python如何在类中定义装饰器的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • Python实现将蓝底照片转化为白底照片功能完整实例

    Python实现将蓝底照片转化为白底照片功能完整实例

    这篇文章主要介绍了Python实现将蓝底照片转化为白底照片功能,结合完整实例形式分析了Python基于cv2库进行图形转换操作的相关实现技巧,需要的朋友可以参考下
    2019-12-12
  • Pytorch使用VGG16模型进行预测猫狗二分类实战

    Pytorch使用VGG16模型进行预测猫狗二分类实战

    VGG16是Visual Geometry Group的缩写,它的名字来源于提出该网络的实验室,本文我们将使用PyTorch来实现VGG16网络,用于猫狗预测的二分类任务,我们将对VGG16的网络结构进行适当的修改,以适应我们的任务,需要的朋友可以参考下
    2023-08-08
  • Python cv2 图像自适应灰度直方图均衡化处理方法

    Python cv2 图像自适应灰度直方图均衡化处理方法

    今天小编就为大家分享一篇Python cv2 图像自适应灰度直方图均衡化处理方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python实现获取照片拍摄日期并重命名的方法

    Python实现获取照片拍摄日期并重命名的方法

    这篇文章主要介绍了Python实现获取照片拍摄日期并重命名的方法,涉及Python针对文件属性及文件名相关操作技巧,需要的朋友可以参考下
    2017-09-09
  • Python基础教程之错误和异常的处理方法

    Python基础教程之错误和异常的处理方法

    程序在运行时,如果python解释器遇到一个错误,会停止程序的执行,并且提示一些错误信息,这就是异常,下面这篇文章主要给大家介绍了关于Python基础教程之错误和异常的处理方法,需要的朋友可以参考下
    2022-05-05
  • 详解Numpy中的广播原则/机制

    详解Numpy中的广播原则/机制

    这篇文章主要介绍了Numpy中的广播原则/机制,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-09-09

最新评论