Python根据文件URL将文件转为Base64字符串

 更新时间:2025年08月13日 10:08:15   作者:yqwang_cn  
这篇文章主要为大家详细介绍了Python根据文件URL(本地路径或网络路径)将文件转为Base64字符串,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下

1.效果

1.1本地文件

1.2网络文件

2.fileToBase64.py

输出日志:/logs/file-to-base64--{当前时间}.log

开放端口:5000

2.1脚本内容

from flask import Flask, request, jsonify
import requests
import base64
import logging
import os
from logging.handlers import TimedRotatingFileHandler
from datetime import datetime
import mimetypes
 
app = Flask(__name__)
 
# 配置日志目录
LOG_DIR = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'logs')
if not os.path.exists(LOG_DIR):
    os.makedirs(LOG_DIR)
 
# 按年月日构建日志文件路径
current_date = datetime.now().strftime('%Y%m%d')
LOG_FILE = os.path.join(LOG_DIR, f'file-to-base64-{current_date}.log')
 
# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(),
        TimedRotatingFileHandler(
            LOG_FILE,
            when='midnight',
            interval=1,
            backupCount=30,
            encoding='utf-8'
        )
    ]
)
 
# 输入:{fileUrl:xxx} 输出:{fileExt:文件类型,len:字符串长度,str:base64字符串}
@app.route('/file-to-base64', methods=['POST'])
def file_to_base64():
    """根据文件URL(本地路径或网络路径)将文件转换为Base64字符串"""
    # 每次请求时打印日志,分割
    logging.info("-----------------------------------------------------------------------------------------------------------------")
    # 1.获取请求头中的 Authorization 字段(可选)
    authorization = request.headers.get('Authorization')
    if authorization != 'dPvnRNtrQhHMxDfGoOEa':
        logging.warning(f"Authorization 字段验证失败: {authorization}")
        return jsonify({"error": "Authorization verification failed"}), 401    
    # 2.获取请求参数
    data = request.json
    if not data or 'file_url' not in data:
        logging.warning("请求参数缺失")
        return jsonify({"error": "file_url is required"}), 400
    # 3. 开始处理文件转换
    file_url = data['file_url']
    logging.info(f"开始处理文件转换,URL: {file_url}")
    
    try:
 
        # 3.1 读取本地文件或网络文件
        if file_url.startswith('file://') or os.path.exists(file_url):
            # 3.1.1 处理本地文件
            if file_url.startswith('file://'):
                file_path = file_url[7:]
            else:
                file_path = file_url
                
            with open(file_path, 'rb') as f:
                file_bytes = f.read()
            content_type = mimetypes.guess_type(file_path)[0] or 'application/octet-stream'
        else:
            # 3.1.2 处理网络文件
            # 问题:HTTPSConnectionPool(host='xx.xx.xx.xx', port=443): Max retries exceeded with url
            # 解决方法:添加 verify=False 忽略证书验证
            response = requests.get(file_url, verify=False)
            response.raise_for_status()
            file_bytes = response.content
            content_type = response.headers.get('Content-Type', '')
 
        # 3.2 通过Content-Type判断文件类型
        file_extension = get_file_extension_from_content_type(content_type)
        # 3.3 将文件转换为Base64字符串
        base64_encoded = base64.b64encode(file_bytes).decode('utf-8')
        # 3.4 添加MIME类型前缀返回(可选)
        if content_type:
            base64_encoded = f"data:{content_type};base64,{base64_encoded}"
        # 3.5 记录转换结果
        logging.info(f"转换成功!文件类型:{file_extension},Base64字符串长度: {len(base64_encoded)}")
        return jsonify({
            "fileExt":file_extension,
            "len":len(base64_encoded),
            "str": base64_encoded
        })
    # 4. 异常处理
    except requests.RequestException as e:
        logging.error(f"请求URL: {file_url}时出错: {e}")
        return jsonify({"error": str(e)}), 500
    except Exception as e:
        logging.error(f"请求URL: {file_url}转换发生未知错误: {e}")
        return jsonify({"error": "Internal server error"}), 500
 
def get_file_extension_from_content_type(content_type):
    """根据Content-Type获取文件扩展名"""
    # 去除字符集信息,只保留MIME类型部分
    mime_type = content_type.split(';')[0].strip().lower()
    mime_to_extension = {
        # 图片类型
        'image/jpeg': 'jpg',
        'image/png': 'png',
        'image/gif': 'gif',
        'image/bmp': 'bmp',
        'image/webp': 'webp',
        'image/svg+xml': 'svg',
        
        # 音频类型
        'audio/wav': 'wav',
        'audio/mpeg': 'mp3',
        'audio/ogg': 'ogg',
        'audio/webm': 'weba',
        
        # 视频类型
        'video/mp4': 'mp4',
        'video/webm': 'webm',
        'video/ogg': 'ogv',
        
        # 文档类型
        'application/pdf': 'pdf',
        'application/msword': 'doc',
        'application/vnd.openxmlformats-officedocument.wordprocessingml.document': 'docx',
        'application/vnd.ms-excel': 'xls',
        'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet': 'xlsx',
        'application/vnd.ms-powerpoint': 'ppt',
        'application/vnd.openxmlformats-officedocument.presentationml.presentation': 'pptx',
        
        # 文本类型
        'text/plain': 'txt',
        'text/html': 'html',
        'text/css': 'css',
        'text/javascript': 'js',
        'application/javascript': 'js',
        'application/json': 'json',
        'application/xml': 'xml',
        
        # 压缩文件
        'application/zip': 'zip',
        'application/x-rar-compressed': 'rar',
        'application/x-tar': 'tar',
        'application/x-gzip': 'gz',
        
        # 其他常见类型
        'application/octet-stream': 'bin',
        'application/x-shockwave-flash': 'swf',
        'application/x-font-ttf': 'ttf',
        'application/x-font-woff': 'woff',
        'application/x-font-woff2': 'woff2'
    }
    return mime_to_extension.get(mime_type, 'unknown')
 
if __name__ == "__main__":
    app.run(host='0.0.0.0', port=5000)

2.2启动查询服务

cd /usr/ai/codes/fileutil
# 运行
python3 fileToBase64.py
 
# 后台运行
nohup python3 fileToBase64.py > /dev/null 2>&1 &
 
# 查看进程
ps -ef | grep fileToBase64.py

2.3访问

注意Header中Authorization=dPvnRNtrQhHMxDfGoOEa目前是写死的。

curl --location --request POST 'http://127.0.0.1:5000/file-to-base64' \
--header 'Authorization: dPvnRNtrQhHMxDfGoOEa' \
--header 'Content-Type: application/json' \
--data-raw '{"file_url":"https://lf-flow-web-cdn.doubao.com/obj/flow-doubao/samantha/logo-icon-white-bg.png"}'

file_url:必填,需要转换的文件地址(公网http地址,或服务器所在文件的绝对路径)

举例:

{"file_url":"https://lf-flow-web-cdn.doubao.com/obj/flow-doubao/samantha/logo-icon-white-bg.png"}

{"file_url":"/usr/ai/codes/fileutil/readMe1.0.0.txt"}

json输出:

{
  "fileExt": "txt",
  "len": 131,
  "str": "data:text/plain;base64,5LiL6L295Zyw5Z2A77yaDQpodHRwczovL2NvZGVsb2FkLmdpdGh1Yi5jb20vbGFuZ2dlbml1cy9kaWZ5L3ppcC9yZWZzL2hlYWRzL21haW4="
}

异常json输出示例:

{
  "error": "file_url is required"
}
 
{
    "errmsg": "Invalid URL 'none': No scheme supplied. Perhaps you meant https://none?"
}

到此这篇关于Python根据文件URL将文件转为Base64字符串的文章就介绍到这了,更多相关Python文件转Base64内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 通过实例解析Python调用json模块

    通过实例解析Python调用json模块

    这篇文章主要介绍了通过实例解析Python调用json模块,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • 使用Python自建轻量级的HTTP调试工具

    使用Python自建轻量级的HTTP调试工具

    这篇文章主要为大家详细介绍了如何使用Python自建一个轻量级的HTTP调试工具,文中的示例代码讲解详细,感兴趣的小伙伴可以参考一下
    2025-04-04
  • Python3利用Dlib19.7实现摄像头人脸识别的方法

    Python3利用Dlib19.7实现摄像头人脸识别的方法

    这篇文章主要介绍了Python 3 利用 Dlib 19.7 实现摄像头人脸识别 ,利用python开发,借助Dlib库捕获摄像头中的人脸,提取人脸特征,通过计算欧氏距离来和预存的人脸特征进行对比,达到人脸识别的目的,感兴趣的小伙伴们可以参考一下
    2018-05-05
  • Python实战小游戏飞机大战详解

    Python实战小游戏飞机大战详解

    飞机大战想必是很多人童年时期的经典游戏,我们依旧能记得抱个老人机娱乐的场景,下面这篇文章主要给大家介绍了关于如何利用python写一个简单的飞机大战小游戏的相关资料,需要的朋友可以参考下
    2021-11-11
  • pytorch 图像预处理之减去均值,除以方差的实例

    pytorch 图像预处理之减去均值,除以方差的实例

    今天小编就为大家分享一篇pytorch 图像预处理之减去均值,除以方差的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • 基于Python实现自制拼图小游戏

    基于Python实现自制拼图小游戏

    这篇文章主要为大家详细介绍得了如何利用Python中pygame的这个非标准库来做个小游戏-拼图,文中的示例代码讲解详细,感兴趣的小伙伴可以尝试一下
    2022-11-11
  • 从零开始的TensorFlow+VScode开发环境搭建的步骤(图文)

    从零开始的TensorFlow+VScode开发环境搭建的步骤(图文)

    这篇文章主要介绍了从零开始的TensorFlow+VScode开发环境搭建的步骤(图文),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • python中的多重继承实例讲解

    python中的多重继承实例讲解

    这篇文章主要介绍了python中的多重继承实例讲解,本文着重讲解寻找父类的顺序,分为经典类和新式类,需要的朋友可以参考下
    2014-09-09
  • Tensorflow的DataSet的使用详解

    Tensorflow的DataSet的使用详解

    本文主要介绍了Tensorflow的DataSet的使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • Python3实现的简单验证码识别功能示例

    Python3实现的简单验证码识别功能示例

    这篇文章主要介绍了Python3实现的简单验证码识别功能,涉及Python针对验证码图片识别处理相关操作技巧,需要的朋友可以参考下
    2018-05-05

最新评论