时间:2021-05-22
在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行处理。
1、需求
根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。
2.脚本思路
首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。
然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。
3.代码
# -*- coding: utf-8 -*-"""Created on Thu Mar 4 21:25:05 2021@author: ruofei""" import pandas as pd #填写待处理文件和对应关系的excel文件路径#注意:脚本运行时需保证被使用excel文件处于关闭状态file1 = r'待处理文件.xlsx'file2 = r'对应关系.xlsx' #填写待处理文件中 全称所在的列名和简称要放置的列名qc1="供应商"jc1="简称" #填写对应关系中 全称所在的列数和简称所在的列数qc2="全称"jc2="简称" #填写读取excel文件的sheet表名sheet1="Sheet1"sheet2="Sheet1" #--------------------*-------------*--------------*---------------------#--------------------*-------------*--------------*---------------------data1 = pd.read_excel(file1, sheet_name = sheet1)data2 = pd.read_excel(file2, sheet_name = sheet2) #print("输出表格所有")#print(data1) row1 = data1.shape[0]#行数col1=data1.shape[1]#列数 row2 = data2.shape[0]#行数col2=data2.shape[1]# #print("表格文件有"+str(row1)+"行,"+str(col1)+"列") duiying=dict() #生成对应关系的字典for i in range(row2): quancheng=data2.loc[i,qc2] jiancheng=data2.loc[i,jc2] duiying[quancheng]=jiancheng #print(quancheng) #company1=data1.loc[0][0]#company2=data1.loc[1][0]#print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2)) for i in range(row1): a=data1.loc[i,qc1] #[qc1-1] #print(str(a)) jiancheng=duiying.get(a) if a in duiying.keys(): #print(jiancheng) data1.loc[i,jc1]=jiancheng else: #此处修改没有简称赋予值,若赋予全称值则=a,若为空则=" " data1.loc[i,jc1]=a data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')4.实现功能
根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原样照填。
5.存在问题
在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
用python来自动生成excel数据文件。python处理excel文件主要是第三方模块库xlrd、xlwt、xluntils和pyExcelerator,除
Python全局锁(1)全局锁导致的问题全局锁的英文简称是GIL,全称是GlobalInterpreterLock(全局解释器锁),来源是python设计之初的
软件着作权名称的要求有: 在进行计算机软件的著作权登记时,需要填写软件的全称和简称。全称就是申请著作权登记的软件的全名,软件全称应当简短明确、针对性强,各种文
大家好,给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl,一个处理excel的python库,处理excel,其实针对
本文实例为大家分享了python处理excel绘制雷达图的具体代码,供大家参考,具体内容如下python处理excel制成雷达图,利用工具plotly在线生成,