Python处理excel根据全称自动填写简称

 更新时间:2021年03月11日 07:28:17   作者:爱吃肠粉的小若  
这篇文章主要为大家详细介绍了Python处理excel根据全称自动填写简称,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理。

1、需求

根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。

2.脚本思路

首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。

然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。

3.代码

# -*- coding: utf-8 -*-
"""
Created on Thu Mar 4 21:25:05 2021
@author: ruofei
"""
 
import pandas as pd
 
 
#填写待处理文件和对应关系的excel文件路径
#注意:脚本运行时需保证被使用excel文件处于关闭状态
file1 = r'待处理文件.xlsx'
file2 = r'对应关系.xlsx'
 
 
#填写待处理文件中 全称所在的列名和简称要放置的列名
qc1="供应商"
jc1="简称"
 
#填写对应关系中  全称所在的列数和简称所在的列数
qc2="全称"
jc2="简称"
 
 
#填写读取excel文件的sheet表名
sheet1="Sheet1"
sheet2="Sheet1"
 
#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)
 
#print("输出表格所有")
#print(data1)
 
row1 = data1.shape[0]#行数
col1=data1.shape[1]#列数
 
row2 = data2.shape[0]#行数
col2=data2.shape[1]#
 
#print("表格文件有"+str(row1)+"行,"+str(col1)+"列")
 
duiying=dict()
 
#生成对应关系的字典
for i in range(row2):
  
  quancheng=data2.loc[i,qc2]
  jiancheng=data2.loc[i,jc2]
  
  duiying[quancheng]=jiancheng
  
  
  #print(quancheng)
 
#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2))
 
for i in range(row1):
  
  a=data1.loc[i,qc1]
  #[qc1-1]
  #print(str(a))
  
  jiancheng=duiying.get(a)
  if a in duiying.keys():
   
    #print(jiancheng)
    data1.loc[i,jc1]=jiancheng 
  else:
    
    
    #此处修改没有简称赋予值,若赋予全称值则=a,若为空则="  "
    data1.loc[i,jc1]=a
 
data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')

4.实现功能

根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原样照填。

5.存在问题

在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Pytest Fixture参数讲解及使用

    Pytest Fixture参数讲解及使用

    这篇文章主要介绍了Pytest之Fixture参数详解及使用,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-01-01
  • 详解pytest传递参数的几种方式

    详解pytest传递参数的几种方式

    本文主要介绍了详解pytest传递参数的几种方式,详细的介绍了4种传参方式,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧
    2024-03-03
  • Python接口自动化系列之unittest结合ddt的使用教程详解

    Python接口自动化系列之unittest结合ddt的使用教程详解

    这篇文章主要介绍了Python接口自动化系列之unittest结合ddt的使用教程详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • python装饰器设置参数方式

    python装饰器设置参数方式

    这篇文章主要介绍了python装饰器设置参数方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • Python组合数据类型详解

    Python组合数据类型详解

    这篇文章主要介绍了Python组合数据类型详解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-08-08
  • Pytorch autograd与逻辑回归的实现详解

    Pytorch autograd与逻辑回归的实现详解

    这篇文章主要为大家介绍了Pytorch autograd与逻辑回归的实现详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-07-07
  • Python属性私有化详解

    Python属性私有化详解

    私有化是为了实现更好的封装形式。能隐藏属性,不被随意修改。以前置双下划线__属性/方法名定义,但是结尾不能是双下划线。如果不让某些属性在类外部被随意更改,可设置成私有属性。在类定义的内部可以访问
    2023-02-02
  • 使用Python进行图像裁剪的多种方法及代码示例

    使用Python进行图像裁剪的多种方法及代码示例

    这篇文章主要介绍了使用Python进行图像裁剪的多种方法,包括使用PIL库和OpenCV库,还提供了高级技巧和示例代码,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2025-01-01
  • python 下划线的不同用法

    python 下划线的不同用法

    在本文中,我们将介绍 Python 中 _ 字符的不同用法。就像 Python 中的许多其他内容一样,我们会看到 “_” 的不同用法主要是惯例问题。这里我们将介绍几种不同的情况。
    2020-10-10
  • python else语句在循环中的运用详解

    python else语句在循环中的运用详解

    这篇文章主要介绍了python else语句在循环中的运用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07

最新评论