Python调用DeepSeek API查询ClickHouse的流程步骤

 更新时间:2026年03月20日 09:38:35   作者:言之。  
本文介绍如何利用DeepSeek API和ClickHouse构建自然语言查询数据库,文章详细说明了环境配置步骤,包括Python安装、必备库安装、DeepSeek API Key获取和ClickHouse连接配置,需要的朋友可以参考下

调用 DeepSeek API,并通过 MCP (Model Context Protocol) 协议接入 mcp-clickhouse,从而让 DeepSeek 能够查询 ClickHouse 数据库来回答用户问题。

  • stdio 模式

前置准备

在运行代码之前,你需要确保环境中有以下依赖:

安装 Python 库

pip install mcp openai

安装 uv (因为你的配置中使用了 uv 来运行 mcp-clickhouse):

pip install uv

获取 DeepSeek API Key:你需要一个有效的 DeepSeek API 密钥。

Python 代码 (main.py)

请将代码中的 <YOUR_DEEPSEEK_API_KEY> 替换为你的实际 Key,并确保 <clickhouse-host> 等配置已填入正确的值。

import asyncio
import os
import json
import sys
from typing import List, Dict, Any, Optional

# 导入 MCP 相关库
from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client
import mcp.types as types

# 导入 OpenAI SDK (DeepSeek 兼容 OpenAI 格式)
from openai import AsyncOpenAI

# ================= 配置部分 =================

# DeepSeek API 配置
DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY", "<YOUR_DEEPSEEK_API_KEY>")
DEEPSEEK_BASE_URL = "https://api.deepseek.com"
MODEL_NAME = "deepseek-chat"  # 或者 "deepseek-reasoner" (R1)

# MCP ClickHouse Server 配置 (来自你的 JSON)
MCP_CLICKHOUSE_CONFIG = {
    "command": "uv",
    "args": [
        "run",
        "--with",
        "mcp-clickhouse",
        "--python",
        "3.10",
        "mcp-clickhouse"
    ],
    "env": {
        "CLICKHOUSE_HOST": "<clickhouse-host>",
        "CLICKHOUSE_PORT": "<clickhouse-port>",
        "CLICKHOUSE_USER": "<clickhouse-user>",
        "CLICKHOUSE_PASSWORD": "<clickhouse-password>",
        "CLICKHOUSE_ROLE": "<clickhouse-role>",
        "CLICKHOUSE_SECURE": "true",
        "CLICKHOUSE_VERIFY": "true",
        "CLICKHOUSE_CONNECT_TIMEOUT": "30",
        "CLICKHOUSE_SEND_RECEIVE_TIMEOUT": "30"
    }
}

# ================= 工具函数 =================

def convert_mcp_tool_to_openai(mcp_tool: types.Tool) -> Dict[str, Any]:
    """
    将 MCP 工具定义转换为 OpenAI/DeepSeek 支持的 Function Calling 格式。
    """
    return {
        "type": "function",
        "function": {
            "name": mcp_tool.name,
            "description": mcp_tool.description,
            "parameters": mcp_tool.inputSchema
        }
    }

# ================= 主逻辑 =================

async def run_chat_loop():
    # 1. 初始化 DeepSeek 客户端
    client = AsyncOpenAI(api_key=DEEPSEEK_API_KEY, base_url=DEEPSEEK_BASE_URL)
    
    # 2. 准备 MCP Server 参数
    server_params = StdioServerParameters(
        command=MCP_CLICKHOUSE_CONFIG["command"],
        args=MCP_CLICKHOUSE_CONFIG["args"],
        env={**os.environ, **MCP_CLICKHOUSE_CONFIG["env"]} # 合并当前环境变量
    )

    print(f"正在启动 MCP Server: {MCP_CLICKHOUSE_CONFIG['command']}...")
    
    # 3. 连接 MCP Server 并开始对话循环
    async with stdio_client(server_params) as (read, write):
        async with ClientSession(read, write) as session:
            # 初始化连接
            await session.initialize()
            
            # 获取 MCP Server 提供的工具列表
            mcp_tools_list = await session.list_tools()
            openai_tools = [convert_mcp_tool_to_openai(tool) for tool in mcp_tools_list.tools]
            
            print(f"\n已连接 MCP Server,加载了 {len(openai_tools)} 个工具: {[t['function']['name'] for t in openai_tools]}")
            print("-" * 50)
            print("你可以开始询问关于 ClickHouse 的问题了 (输入 'quit' 退出)。")

            messages = [
                {"role": "system", "content": "你是一个智能助手,可以利用工具查询 ClickHouse 数据库来回答用户问题。"}
            ]

            while True:
                user_input = input("\n用户: ")
                if user_input.lower() in ["quit", "exit"]:
                    break

                messages.append({"role": "user", "content": user_input})

                # 第一轮调用:发送用户问题 + 工具定义给 DeepSeek
                try:
                    response = await client.chat.completions.create(
                        model=MODEL_NAME,
                        messages=messages,
                        tools=openai_tools,
                    )
                except Exception as e:
                    print(f"API 调用错误: {e}")
                    continue

                assistant_msg = response.choices[0].message
                messages.append(assistant_msg)

                # 检查 DeepSeek 是否想调用工具
                if assistant_msg.tool_calls:
                    print(f"\n[思考] 模型决定调用工具...")
                    
                    for tool_call in assistant_msg.tool_calls:
                        tool_name = tool_call.function.name
                        tool_args = json.loads(tool_call.function.arguments)
                        
                        print(f"  -> 调用工具: {tool_name}, 参数: {tool_args}")

                        # 执行 MCP 工具
                        try:
                            mcp_result = await session.call_tool(tool_name, arguments=tool_args)
                            
                            # 获取文本结果 (ClickHouse MCP 通常返回文本或 JSON 文本)
                            tool_output = ""
                            if mcp_result.content:
                                for content in mcp_result.content:
                                    if content.type == "text":
                                        tool_output += content.text
                            
                            print(f"  <- 工具返回结果 (前100字符): {tool_output[:100]}...")

                            # 将工具结果添加回对话历史
                            messages.append({
                                "role": "tool",
                                "tool_call_id": tool_call.id,
                                "content": tool_output
                            })

                        except Exception as e:
                            error_msg = f"工具执行出错: {str(e)}"
                            print(f"  ! {error_msg}")
                            messages.append({
                                "role": "tool",
                                "tool_call_id": tool_call.id,
                                "content": error_msg
                            })

                    # 第二轮调用:将工具结果发送回 DeepSeek 获取最终回答
                    final_response = await client.chat.completions.create(
                        model=MODEL_NAME,
                        messages=messages,
                        # 这里依然传入 tools,以防模型需要继续多步调用
                        tools=openai_tools, 
                    )
                    
                    final_content = final_response.choices[0].message.content
                    print(f"\nDeepSeek: {final_content}")
                    messages.append(final_response.choices[0].message)
                
                else:
                    # 如果不需要调用工具,直接输出结果
                    print(f"\nDeepSeek: {assistant_msg.content}")

if __name__ == "__main__":
    # Windows 下通常需要这个策略
    if sys.platform.startswith('win'):
        asyncio.set_event_loop_policy(asyncio.WindowsSelectorEventLoopPolicy())
        
    asyncio.run(run_chat_loop())

代码逻辑解释

MCP 连接 (stdio_client):

  • 代码使用 uv run ... 命令启动 mcp-clickhouse 的子进程。
  • 通过标准输入/输出 (stdio) 与该进程建立通信通道。
  • CLICKHOUSE_HOST 等敏感信息通过环境变量 (env) 传递给子进程,保证安全性。

工具发现与转换 (convert_mcp_tool_to_openai):

  • session.list_tools() 从 mcp-clickhouse 获取可用的工具(例如执行 SQL 查询的工具)。
  • 由于 MCP 的工具定义格式与 OpenAI/DeepSeek 的 Function Calling 格式略有不同(主要在于外层结构),代码中定义了一个转换函数将其适配。

对话循环 (Chat Loop):

  • User Input: 接收你的问题。
  • First API Call: 将问题和转换后的工具列表发送给 DeepSeek。
  • Tool Execution: 如果 DeepSeek 返回 tool_calls(例如它生成了一个 SQL 语句来查询数据),Python 代码会拦截这个请求,通过 session.call_tool 在本地的 mcp-clickhouse 服务中执行该 SQL。
  • Second API Call: 将 ClickHouse 返回的查询结果(数据)作为 tool 类型的消息发回给 DeepSeek。
  • Final Answer: DeepSeek 根据查询结果生成最终的自然语言回答。

运行示例

假设你问:“查询 users 表里有多少行数据?”

  1. DeepSeek 分析意图,返回 tool_calls,调用 query_sql 工具,参数为 SELECT count() FROM users
  2. Python 脚本通过 MCP 执行该 SQL。
  3. ClickHouse 返回 105
  4. Python 脚本将 105 发给 DeepSeek。
  5. DeepSeek 回答:“users 表里共有 105 行数据。”

到此这篇关于Python调用DeepSeek API查询ClickHouse的流程步骤的文章就介绍到这了,更多相关Python DeepSeek API查询ClickHouse内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中lower函数实现方法及用法讲解

    python中lower函数实现方法及用法讲解

    在本篇文章里小编给大家整理的是一篇关于python中lower函数实现方法及用法讲解内容,有需要的朋友们可以学习参考下。
    2020-12-12
  • 使用Python编写一个自动化图片格式转换工具

    使用Python编写一个自动化图片格式转换工具

    这篇文章主要为大家详细介绍了如何使用Python编写一个自动化图片格式转换工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-07-07
  • django模型中的字段和model名显示为中文小技巧分享

    django模型中的字段和model名显示为中文小技巧分享

    这里给大家分享2个可以让django模型中的字段和model名显示为中文的小技巧,非常的简单实用,给需要的小伙伴参考下。
    2014-11-11
  • python for循环输入一个矩阵的实例

    python for循环输入一个矩阵的实例

    今天小编就为大家分享一篇python for循环输入一个矩阵的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • python移位运算的实现

    python移位运算的实现

    这篇文章主要介绍了python移位运算的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • Python numpy 模块介绍

    Python numpy 模块介绍

    这篇文章主要介绍了Python numpy 模块,在motplotlib的学习过程中,我们使用最多的就是numpy模块。下面我们将使用numpy进行创建数组、切片、索引、广播等功能实操,需要的朋友可以参考一下
    2022-01-01
  • python中如何让输出不换行

    python中如何让输出不换行

    这篇文章主要介绍了python中如何让输出不换行问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-05-05
  • 利用Hyperic调用Python实现进程守护

    利用Hyperic调用Python实现进程守护

    这篇文章主要为大家详细介绍了利用Hyperic调用Python实现进程守护,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • Pycharm报错Environment location directory is not empty问题及解决

    Pycharm报错Environment location directory is not empty问题及

    这篇文章主要介绍了Pycharm报错Environment location directory is not empty问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-09-09
  • Sublime开发python程序的示例代码

    Sublime开发python程序的示例代码

    本篇文章主要介绍了Sublime开发python程序的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-01-01

最新评论