使用Python实现调用API获取图片存储到本地的方法

 更新时间:2025年05月23日 11:08:03   作者:猴麦麦  
开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接调用API获取的文件完全一致,下面给大家介绍使用Python实现调用API获取图片存储到本地的方法,感兴趣的朋友一起看看吧

使用Python实现调用API获取图片存储到本地

1、项目概述

开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接调用API获取的文件完全一致。

2、核心功能

自动解析含嵌套结构的JSON输入文件

API请求模拟引擎

精确复现Postman请求行为

支持自动重定向跟踪

禁用自动解压缩(保留原始二进制流)

3、环境准备

# 安装依赖
pip install requests python-magic-bin==0.4.24  # Windows
pip install requests python-magic           # Linux/macOS

编辑input.json文件格式:

[
  {
    "postimage": "{...}",
    "preimage": "{...}",
    "original_image_id": "6cd6187a-a20e-f011-998a-000d3ac8927d"
  },
  // 更多数据条目...
]

4、代码实现

import json
import requests
import base64
import os
import mimetypes
# 配置参数
INPUT_JSON = "input.json"  # 输入的JSON文件路径
OUTPUT_DIR = "raw_images"   # 图片输出目录(修改目录以示区别)
API_URL = "https://prod-53.southeastasia.logic.azure.com:443/workflows/8de920a489c7490a9e2207bd538ce964/triggers/manual/paths/invoke?api-version=2016-06-01&sp=%2Ftriggers%2Fmanual%2Frun&sv=1.0&sig=qO01WQl5tzDZeGpeVid43SpndovXbq4G7QO0NWcz7B8"
def determine_image_type(base64_str):
    """通过数据URI或魔术数字检测图片类型"""
    try:
        # 处理数据URI格式
        if base64_str.startswith("data:image/"):
            mime_type = base64_str.split(";")[0].split(":")[1]
            return mimetypes.guess_extension(mime_type) or ".png"
        # 通过魔术数字检测原始二进制格式
        decoded = base64.b64decode(base64_str)
        if decoded.startswith(b'\xff\xd8\xff'):
            return ".jpg"
        elif decoded.startswith(b'\x89PNG\r\n\x1a\n'):
            return ".png"
        elif decoded.startswith(b'GIF87a') or decoded.startswith(b'GIF89a'):
            return ".gif"
        elif decoded.startswith(b'RIFF') and decoded[8:12] == b'WEBP':
            return ".webp"
    except Exception:
        pass
    return ".bin"  # 未知类型
def process_images():
    # 创建输出目录
    os.makedirs(OUTPUT_DIR, exist_ok=True)
    # 读取JSON文件
    try:
        with open(INPUT_JSON, 'r', encoding='utf-8') as f:
            data = json.load(f)
    except Exception as e:
        print(f"读取JSON文件失败: {e}")
        return
    # 遍历处理每个条目
    for idx, item in enumerate(data, 1):
        image_id = item.get("original_image_id")
        if not image_id:
            print(f"条目 {idx} 缺少original_image_id,已跳过")
            continue
        print(f"正在处理 ({idx}/{len(data)}): {image_id}")
        # 调用API
        try:
            response = requests.post(
                API_URL,
                json={"EntityGuid": image_id},
                headers={"Content-Type": "application/json"},
                timeout=60  # 延长超时时间
            )
            print(f"响应状态码: {response.status_code}")
            response.raise_for_status()
        except requests.exceptions.RequestException as e:
            print(f"API调用失败: {str(e)[:200]}")  # 显示部分错误信息
            continue
        # 处理base64数据
        try:
            base64_str = response.text
            # 检测并分割数据URI
            if "," in base64_str:
                header, payload = base64_str.split(",", 1)
                file_ext = determine_image_type(header)
                base64_str = payload
            else:
                decoded = base64.b64decode(base64_str)
                file_ext = determine_image_type(base64_str)
            # 解码base64
            image_data = base64.b64decode(base64_str)
            # 生成文件名(保留原始格式)
            output_path = os.path.join(OUTPUT_DIR, f"{image_id}{file_ext}")
            # 保存原始二进制数据
            with open(output_path, "wb") as f:
                f.write(image_data)
            print(f"原始图片已保存至: {output_path} ({len(image_data):,} bytes)")
        except Exception as e:
            print(f"处理失败: {str(e)[:200]}")
if __name__ == "__main__":
    process_images()

5、结果查看

补充:python 图片抓取 并保存到本地

import requests
from bs4 import BeautifulSoup
from PIL import Image
import os 
from io import BytesIO
import time
url = "http://www.yestone.com/gallery/1501754333627"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}
r = requests.get(url, headers=headers)
soup = BeautifulSoup(r.content, 'html.parser')
items = soup.find('div',class_='images-list')
folder_path = './photo'
# html = requests.get('http://st2.cdn.yestone.com/thumbs/2704315/vector/11688/116887226/api_thumb_450.jpg')
# html = requests.get('/_nuxt/img/4c1a746.jpg')
# print(html.content)
# image = Image.open(BytesIO(html.content))
# image.save(folder_path+"/aaa.jpg")
# print(items.find_all('img'))
# exit()
if os.path.exists(folder_path) == False:
   os.makedirs(folder_path)
for index, item in enumerate(items.find_all('img')):
    if item:
        html = requests.get(item.get('src'))
        img_name = str(index + 1) + '.jpg'
        image = Image.open(BytesIO(html.content))
        image.save(folder_path+"/"+img_name)
        print('第%d张图片下载完成' % (index + 1))
        time.sleep(1)  # 自定义延时
print('抓取完成')

到此这篇关于使用Python实现调用API获取图片存储到本地的文章就介绍到这了,更多相关python 获取图片存储到本地内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Selenium 配置启动项参数的方法

    Selenium 配置启动项参数的方法

    这篇文章主要介绍了Selenium 配置启动项参数的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • python得到一个excel的全部sheet标签值方法

    python得到一个excel的全部sheet标签值方法

    今天小编就为大家分享一篇python得到一个excel的全部sheet标签值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 利用python+request通过接口实现人员通行记录上传功能

    利用python+request通过接口实现人员通行记录上传功能

    这篇文章主要介绍了利用python+request通过接口实现人员通行记录上传功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01
  • python web.py启动https端口的方式

    python web.py启动https端口的方式

    这篇文章主要介绍了python web.py启动https端口,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-05-05
  • Django操作session 的方法

    Django操作session 的方法

    这篇文章主要介绍了Django操作session 的方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • python手机号前7位归属地爬虫代码实例

    python手机号前7位归属地爬虫代码实例

    这篇文章主要介绍了python手机号前7位归属地爬虫代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • pyqt5 tablewidget 利用线程动态刷新数据的方法

    pyqt5 tablewidget 利用线程动态刷新数据的方法

    今天小编就为大家分享一篇pyqt5 tablewidget 利用线程动态刷新数据的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • Python数据可视化Pyecharts库实现桑葚图效果

    Python数据可视化Pyecharts库实现桑葚图效果

    这篇文章主要介绍了Python数据可视化如何使用Pyecharts库来实现桑葚图效果图,文中给出实现的示例代码,有需要的朋友可以借鉴参考想,希望能够有所帮助
    2021-09-09
  • python selenium对应的浏览器chromedriver版本不一致问题

    python selenium对应的浏览器chromedriver版本不一致问题

    这篇文章主要介绍了python selenium对应的浏览器chromedriver版本不一致问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Python3标准库之threading进程中管理并发操作方法

    Python3标准库之threading进程中管理并发操作方法

    这篇文章主要介绍了Python3标准库之threading进程中管理并发操作方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03

最新评论