使用Python从零搭建一个AI Agent的实战指南

 更新时间:2026年05月08日 08:25:51   作者:Xidaoapi  
2026年最火的概念之一就是AI Agent——让大模型不再只是聊天机器人,而是能自主规划、调用工具、完成复杂任务的智能体,本文用纯Python从零实现一个可用的Agent,不依赖任何框架,需要的朋友可以参考下

引言

2026年最火的概念之一就是AI Agent——让大模型不再只是聊天机器人,而是能自主规划、调用工具、完成复杂任务的智能体。本文用纯Python从零实现一个可用的Agent,不依赖任何框架。

Agent的核心循环

Agent的本质就一个循环:思考→行动→观察→再思考。

用户输入 → LLM推理 → 决定是否调用工具 → 执行工具 → 观察结果 → 继续推理 → 输出

最小实现

import json
from openai import OpenAI

client = OpenAI()  # 确保API key已配置

# 定义工具
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "获取指定城市的天气",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "城市名称"}
                },
                "required": ["city"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "calculate",
            "description": "执行数学计算",
            "parameters": {
                "type": "object",
                "properties": {
                    "expression": {"type": "string", "description": "数学表达式"}
                },
                "required": ["expression"]
            }
        }
    }
]

# 工具实现
def get_weather(city: str) -> str:
    # 实际项目中接入天气API
    return f"{city}今天晴,气温22°C"

def calculate(expression: str) -> str:
    try:
        result = eval(expression)  # 生产环境请用安全解析器
        return str(result)
    except Exception as e:
        return f"计算错误: {e}"

TOOL_MAP = {
    "get_weather": get_weather,
    "calculate": calculate,
}

def run_agent(user_input: str, max_steps: int = 5) -> str:
    messages = [{"role": "user", "content": user_input}]

    for step in range(max_steps):
        response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            tools=tools,
            tool_choice="auto"
        )

        msg = response.choices[0].message
        messages.append(msg)

        # 没有工具调用,直接返回结果
        if not msg.tool_calls:
            return msg.content

        # 执行工具调用
        for tool_call in msg.tool_calls:
            fn_name = tool_call.function.name
            fn_args = json.loads(tool_call.function.arguments)

            print(f"  🔧 调用工具: {fn_name}({fn_args})")
            result = TOOL_MAP[fn_name](**fn_args)

            messages.append({
                "role": "tool",
                "tool_call_id": tool_call.id,
                "content": result
            })

    return "达到最大步数限制"

实际运行

# 简单查询
print(run_agent("北京天气怎么样?"))
# 🔧 调用工具: get_weather({'city': '北京'})
# 北京今天晴,气温22°C

# 多步推理
print(run_agent("北京和上海哪个更暖和?"))
# 🔧 调用工具: get_weather({'city': '北京'})
# 🔧 调用工具: get_weather({'city': '上海'})
# 根据查询结果,上海今天25°C,北京22°C,上海更暖和

加上记忆系统

单轮Agent只是开始。真正的Agent需要跨对话记住信息:

import sqlite3

class AgentMemory:
    def __init__(self, db_path: str = "agent_memory.db"):
        self.conn = sqlite3.connect(db_path)
        self.conn.execute("""
            CREATE TABLE IF NOT EXISTS memories (
                id INTEGER PRIMARY KEY,
                key TEXT UNIQUE,
                value TEXT,
                created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
            )
        """)
        self.conn.commit()

    def save(self, key: str, value: str):
        self.conn.execute(
            "INSERT OR REPLACE INTO memories (key, value) VALUES (?, ?)",
            (key, value)
        )
        self.conn.commit()

    def recall(self, key: str) -> str | None:
        row = self.conn.execute(
            "SELECT value FROM memories WHERE key = ?", (key,)
        ).fetchone()
        return row[0] if row else None

    def list_all(self) -> list[dict]:
        rows = self.conn.execute(
            "SELECT key, value FROM memories ORDER BY created_at DESC LIMIT 20"
        ).fetchall()
        return [{"key": r[0], "value": r[1]} for r in rows]

把记忆工具加入Agent的tools列表,Agent就能自主决定什么时候存取信息了。

关键设计原则

  1. 工具描述要精确——LLM根据description决定何时调用,描述模糊会导致错误调用
  2. 限制最大步数——防止死循环,5-10步足够大多数任务
  3. 错误处理要优雅——工具失败时返回有意义的错误信息,而不是抛异常
  4. 用streaming提升体验——长推理过程让用户看到中间输出

与框架对比

方案灵活性学习成本适合场景
纯Python(本文)最高定制化Agent
LangChain Agent中等标准化工作流
CrewAI较低中等多Agent协作
Dify最低零代码搭建

先用纯Python搞懂原理,再用框架提效,这是最稳的学习路径。

到此这篇关于使用Python从零搭建一个AI Agent的实战指南的文章就介绍到这了,更多相关Python搭建AI Agent内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python实现多线程暴力破解登陆路由器功能代码分享

    python实现多线程暴力破解登陆路由器功能代码分享

    这篇文章主要介绍了python实现多线程暴力破解登陆路由器功能代码分享,本文直接给出实现代码,需要的朋友可以参考下
    2015-01-01
  • python中正则表达式findall的用法实例

    python中正则表达式findall的用法实例

    在写着自动化测试的脚本时重新复习了一下正则表达式findall()方法,下面这篇文章主要给大家介绍了关于python中正则表达式findall用法的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • python中的布隆过滤器用法及原理详解

    python中的布隆过滤器用法及原理详解

    这篇文章主要介绍了python中的布隆过滤器用法及原理详解,布隆过滤器是一种概率空间高效的数据结构,它与hashmap非常相似,用于检索一个元素是否在一个集合中。它在检索元素是否存在时,能很好地取舍空间使用率与误报比例,需要的朋友可以参考下
    2023-07-07
  • python的简单四则运算语法树可视化

    python的简单四则运算语法树可视化

    这篇文章主要介绍了python的简单四则运算语法树可视化,这篇文章的内容也很简单,就是给定一个四则运算的表达式,画出它的语法树,需要的朋友可以参考下
    2023-04-04
  • Python获取Docker容器实时资源占用(CPU、内存、IO等)5种实现方式

    Python获取Docker容器实时资源占用(CPU、内存、IO等)5种实现方式

    在运维监控、容器管理平台、云桌面系统等场景中,我们经常需要实时获取 Docker 容器的资源使用情况,本文总结了5种常用的实现方式,有需要的可以了解下
    2025-12-12
  • Django框架会话技术实例分析【Cookie与Session】

    Django框架会话技术实例分析【Cookie与Session】

    这篇文章主要介绍了Django框架会话技术,结合实例形式分析了Django框架Cookie与Session相关使用技巧与注意事项,需要的朋友可以参考下
    2019-05-05
  • Pandas替换及部分替换(replace)实现流程详解

    Pandas替换及部分替换(replace)实现流程详解

    这篇文章主要介绍了Pandas替换及部分替换(replace)实现流程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • python matplotlib饼状图参数及用法解析

    python matplotlib饼状图参数及用法解析

    这篇文章主要介绍了python matplotlib饼状图参数及用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • 使用Python实现写入多类型数据至Excel文件

    使用Python实现写入多类型数据至Excel文件

    Python 凭借其丰富的生态系统,在办公自动化领域展现出显著优势,本文将介绍如何使用 Free Spire.XLS for Python 库,以程序化方式高效、可靠地将多种数据类型写入 Excel 文件,希望对大家有所帮助
    2025-12-12
  • Python time时间格式化和设置时区实现代码详解

    Python time时间格式化和设置时区实现代码详解

    这篇文章主要介绍了Python time时间格式化和设置时区实现代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值
    2023-02-02

最新评论