Python3脚本实现Excel与TXT的智能转换

 更新时间:2025年02月27日 14:54:58   作者:XMYX-0  
在数据处理的日常工作中,我们经常需要将Excel中的结构化数据转换为其他格式,本文将使用Python3实现Excel与TXT的智能转换,需要的可以了解下

在数据处理的日常工作中,我们经常需要将Excel中的结构化数据转换为其他格式。本文将手把手教你如何用Python轻松实现Excel到TXT的智能转换,让重复性工作自动化,效率提升立竿见影!

场景应用:为什么需要这种转换

当遇到以下场景时,这个脚本将成为你的得力助手:

  • 批量生成配置文件:将服务器配置信息从Excel快速生成可部署的文本文件
  • 问卷数据处理:将收集到的开放式问题答案自动整理成独立文档
  • 文档自动化生成:根据产品参数表快速创建产品说明文档
  • 多语言资源处理:将翻译好的多语言文本批量生成对应语言包文件
  • 数据分析预处理:将特定列数据提取为机器学习可读的文本格式

技术解析:代码实现详解

核心代码展示

import openpyxl
import os

def xlsx_to_txt(file_path, output_dir="output", header_row=1):
    """
    将Excel文件内容转换为多个TXT文件
    
    参数:
    file_path (str): Excel文件路径
    output_dir (str): 输出目录,默认为"output"
    header_row (int): 标题行数,默认为1
    """
    try:
        # 创建输出目录
        os.makedirs(output_dir, exist_ok=True)
        
        # 加载Excel工作簿
        workbook = openpyxl.load_workbook(file_path)
        sheet = workbook.active

        # 遍历每一行
        for row_num, row in enumerate(sheet.iter_rows(values_only=True), start=1):
            if row_num > header_row:  # 跳过标题行
                # 检查序号列是否为空
                if row[0] is None:
                    print(f"警告:第{row_num}行缺少序号,已跳过")
                    continue
                    
                # 检查内容列是否为空
                if row[1] is None:
                    print(f"警告:第{row_num}行内容为空,已跳过")
                    continue
                    
                # 清理文件名中的非法字符
                safe_filename = "".join(c for c in str(row[0]) if c.isalnum() or c in (' ', '_')).rstrip()
                if not safe_filename:
                    print(f"警告:第{row_num}行文件名无效,已跳过")
                    continue
                    
                # 写入文件
                output_path = os.path.join(output_dir, f"{safe_filename}.txt")
                try:
                    with open(output_path, "w", encoding="utf-8") as txt_file:
                        txt_file.write(str(row[1]))
                    print(f"成功创建文件: {output_path}")
                except Exception as e:
                    print(f"错误:无法写入文件 {output_path} - {str(e)}")
                        
    except FileNotFoundError:
        print(f"错误:文件 {file_path} 不存在!")
    except Exception as e:
        print(f"程序运行出错: {str(e)}")

# 示例调用
xlsx_to_txt('data.xlsx')

改进点说明

1.输出目录管理

新增output_dir参数,自动创建输出目录

2.文件名安全处理

过滤文件名中的非法字符,避免创建文件失败

3.空值双重检查

同时检查文件名和内容列,确保数据完整性

4.错误处理增强

添加全面的异常捕获,提高程序健壮性

5.进度反馈

添加成功/失败提示,方便追踪处理结果

实战演练:从Excel到TXT的完整流程

准备数据示例(data.xlsx)

执行转换

data.xlsx与test.py再同一级目录

python3 test.py

生成结果

成功创建文件: output/10.txt
警告:第3行缺少序号,已跳过
成功创建文件: output/12.txt
警告:第5行内容为空,已跳过
成功创建文件: output/14.txt
警告:第7行缺少序号,已跳过
成功创建文件: output/16.txt
成功创建文件: output/17.txt
成功创建文件: output/18.txt

功能扩展:按需定制你的转换器

1.多列内容合并

content = '\n'.join([str(cell) for cell in row[1:] if cell])

2.自动编号

filename = f"{row_num}_{safe_filename}"

3.保留原始格式

from openpyxl.styles import numbers
if cell.number_format == numbers.FORMAT_DATE_XLSX22:
    # 处理日期格式

4.添加日志系统

import logging
logging.basicConfig(filename='converter.log', level=logging.INFO)

最佳实践与避坑指南

1.数据预处理

  • 使用Excel的"数据验证"功能确保文件名列的合法性
  • 检查特殊字符:/\:*?"<>|等Windows禁用字符

2.性能优化

  • 对于10万行以上数据,改用csv模块读取
  • 使用with语句批量处理文件写入

3.异常处理

  • 添加文件权限检查
  • 处理磁盘空间不足的情况

4.版本兼容

  • 支持.xlsx格式(openpyxl)
  • 如需处理.xls文件,可改用xlrd库

应用场景升级:企业级解决方案

对于更复杂的业务需求,可以扩展为:

1.云端部署方案

  • 通过Flask构建Web服务
  • 支持文件上传和结果下载

2.邮件自动发送

import smtplib
# 将生成的txt文件作为附件自动发送

3.数据库集成

import sqlite3
# 将转换记录存入数据库

4.日志监控系统

import logging
logging.basicConfig(filename='converter.log')

以上就是Python3脚本实现Excel与TXT的智能转换的详细内容,更多关于Python3 Excel转TXT的资料请关注脚本之家其它相关文章!

相关文章

  • Python使用指定字符长度切分数据示例

    Python使用指定字符长度切分数据示例

    今天小编就为大家分享一篇Python使用指定字符长度切分数据示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Pycharm快速安装OpenCV的详细操作步骤

    Pycharm快速安装OpenCV的详细操作步骤

    Pycharm中使用OpenCV,其实也就是用Python语言调用OpenCV,下面这篇文章主要给大家介绍了关于Pycharm快速安装OpenCV的详细操作步骤,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • Python类super()及私有属性原理解析

    Python类super()及私有属性原理解析

    这篇文章主要介绍了Python类super()及私有属性原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • 一文全面详解Python变量作用域

    一文全面详解Python变量作用域

    变量作用域是Python中非常重要的概念,它决定了在哪里可以访问变量,下面我将用通俗易懂的方式,结合代码示例和图表,带你全面了解Python变量作用域,需要的朋友可以参考下
    2025-06-06
  • 分享python中matplotlib指定绘图颜色的八种方式

    分享python中matplotlib指定绘图颜色的八种方式

    这篇文章主要给大家分享的是python中matplotlib指定绘图颜色的八种方式,在使用matplotlib的pyplot库进行绘图时,经常会发现各种开源代码指定“color”的方式并不一致,下面就向大家展示8种指定color的方式,需要的朋友可以参考一下
    2022-03-03
  • pandas 缺失值与空值处理的实现方法

    pandas 缺失值与空值处理的实现方法

    这篇文章主要介绍了pandas 缺失值与空值处理的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • GPU排队脚本实现空闲触发python脚本实现示例

    GPU排队脚本实现空闲触发python脚本实现示例

    有的服务器是多用户使用,GPU的资源常常被占据着,很可能在夜间GPU空闲了,但来不及运行自己的脚本。如果没有和别人共享服务器的话,自己的多个程序想排队使用GPU,也可以用这个脚本
    2021-11-11
  • Python创建一个功能齐全的随机验证码生成器

    Python创建一个功能齐全的随机验证码生成器

    验证码通过生成一张包含难以识别的文本、数字或图像的图像,要求用户正确输入其中的内容,用于验证用户身份,本篇教程将带领您一步步使用Python创建一个功能齐全的随机验证码生成器,我们将通过导入必要的库、定义辅助函数以及编写主函数check_code()
    2024-04-04
  • 使用Python批量生成PPT版荣誉证书的示例代码

    使用Python批量生成PPT版荣誉证书的示例代码

    使用Python处理PPT文件通常需要使用第三方库来简化对PPT文件的读取、写入和修改操作,本文将给大家介绍一个小案例,使用Python批量生成PPT版荣誉证书,感兴趣的同学跟着小编一起来看看吧
    2023-08-08
  • 在Python中轻松将元组转换为列表的四种实现方法

    在Python中轻松将元组转换为列表的四种实现方法

    在python中,元组(tuple)和列表(list)是两种常见的序列类型,元组是不可变的,这意味着一旦创建,就不能修改它的内容,而列表是可变的,你可以添加、删除或修改元素,本文给大家介绍了如何在Python中轻松将元组转换为列表,需要的朋友可以参考下
    2025-04-04

最新评论