小编最近发现了一个新功能,想给大家分享分享 。我们知道,python这门语言可以运用在各大领域中,小编就想如果我使用Excel来结合一下python能做点啥呢 。今天我就给大家分享一下python实现从一个excel筛选后生成新表 。
文章插图
Python对于Excel表来说,也是非常方便的,我们可以使用python的pandas模块,但是这个最大的问题就是,DataFrame导出的Excel是不具有原表格的格式,那么谁具有这个功能呢,那就是openpyxl模块,不过要命的是,openpyxl读取的单元格的value,如果单元格是经过公式加工的,则读取的就是公式本身,而不是加工后的数据 。
不过不去想公式的问题,使用openpyxl模块来实现这个功能还是可以的,代码如下:
#从国家列表中,筛选地区为亚洲的行from openpyxl import load_workbookwb=load_workbook('world.xlsx')for sheet in wb.sheetnames: #遍历每一个sheet ws=wb[sheet] seg='地区' #筛选地区为亚洲国家 cols=next(ws.values) #标题行 index=cols.index(seg) #地区字段的序列号 offset=0 #每次行被删,行号就会变化,这里是偏差 dellist=[] #存储要删的行的行号列表 for i in range(2,ws.max_row+1): region=ws.cell(row=i,column=index+1).value if(region!='亚洲'): dellist.append(i) for i in dellist: ws.delete_rows(i-offset) #注意openpyxl版本必须在2.5以上否则不能 offset+=1wb.save('asia.xlsx')好像看起来没什么问题,可能你不知道的是出现了一个非常致命的问题,那就是执行效率很差!如果文件不到100K还好,否则执行会非常缓慢 。
考虑到公式的问题怎么办呢,我的思路就是二者的结合,先使用Pandas模块,把数据筛选导出成Excel 。然后使用openpyxl模块,把原表的单元格式复制到新表,这里面一个难点就是必须搞清楚原表和新表的单元格的映射 。
【Python如何实现excel筛选后生成新表?干货来了一定要收藏!】
#第一步 利用Dataframe筛选生成Excel 设定原表为oldfile 新表为newfilefrom openpyxl import load_workbookfrom openpyxl.utils import get_column_letter #列编号对应的字符from copy import copyimport pandas as pdcellmap={}writer=pd.ExcelWriter(newfile) alldata=https://www.ycpai.cn/python/pd.read_excel(oldfile,None)for sheet in alldata.keys(): #遍历每一个sheet celllmap[sheet]={} data=alldata[sheet].fillna('-') data=data.loc[data.要筛选的字段=='某数值'] data.to_excel(writer,sheet,index=False) #确认新表和原表的单元格对应关系 k=1 #新表的单元格行号,从1开始递增 rowlist=[1]+list(data.index+2) #原表的df对应的单元格行号列表 for rowid in rowlist: for col in range(len(data.columns)): #col为每列的列编号 letter=get_column_letter(col+1) #col对应的列字母 code2=letter+str(k) code1=letter+str(rowid) cellmap[sheet][code2]=code1 k=k+1 writer.save()#第二步 复制原表的单元格格式到新表wb1=load_workbook(oldfile)wb2=load_workbook(newfiie)for sheet in wb2.sheetnames: ws1=wb1[sheet] ws2=wb2[sheet] ws2.data_validations=copy(ws1.data_validations) #复制序列等效性 for cell2 in cellmap[sheet]: cell1=cellmap[sheet][cell2] ws2[cell2].fill=copy(ws1[cell1].fill) ws2[cell2].font=copy(ws1[cell1].font) ws2[cell2].number_format=copy(ws1[cell1].number_format) wb2.save(newfile)
推荐阅读
- Python自定义类要怎么写?Python类该怎么去用
- python怎样求1到100的奇数和?超详细的方法来了
- Python数据可视化库plotly库是什么?Python库plotly怎么用
- 怎么用anaconda打开ipython?超简单的两个方法你一学就会
- 京东如何处理被投诉的店家?惩罚有哪些?
- 京东每日特价如何报名?报名要求有哪些?
- Ubuntu操作系统中怎么将python卸载?Ubuntu卸载python的步骤是什么
- Python中如何创建set类型?浅析python中的set类型
- python实现引用其他路径包里面的模块 巧妙使用python引用其他路径包中的模块
- Python变量命名不能有什么符号?Python变量命名有哪些限制