告别单调工作系列——利用python再次拯救漂亮妹子

上一篇告别单调工作系列——利用python拯救漂亮妹子中「拯救」了漂亮妹子之后,原本以为事情告一段落,哪知道......

起因

记得帮妹子搞定自动提交表单之后的第三天,妹子端着奶茶乐呵呵的来找我,和我一番畅谈理想,又指点江山之后,终于切入了正题。

大致的意思就是通过excel自动提交表单数据你帮我搞定了,你好厉害,现在整理excel的工作我也不是很想做,你有没有办法帮我搞定,搞定之后不会亏待你的,奶茶一定双手奉上。

碰到这样的事情其实我的内心是拒绝的,这明显有点‘贪得无厌’,不知道什么叫见好就收吗?

可是,谁叫人家妹子长得漂亮呢,嘴巴又甜,被她这么忽悠了几下,习惯性的开始调研起需求来了,哎,这职业习惯得改改。

经过

聊了十几分钟之后,大致了解了需求,其实就是有几个部门每天会发来固定的excel,她需要根据一定的要求整理汇总,有问题的数据联系对应的人去处理,没有问题的数据再录入到系统。

要了excel模板和具体的整理规则之后,漂亮妹子乐呵呵的走了,我有点后悔,又要牺牲自己的下班时间了,哎,好人难做啊。

理了下思路,其实解决这个需求不是很难。

首先先约定好规则,包括excel的命名,存放路径,excel格式等。其中excel命名和格式已经是固定的,不用操太多心。

但存放路径不定,基本上都是通过邮件来沟通的,原本想去遍历邮件去获取附件的,但考虑到无法判断哪份excel是最终版,所以这一步就算了,让业务自行判断后放到统一的路径下。

接下来就是遍历指定路径下的excel,根据业务给的数据规则进行整合,整合之后生成一个目标excel,一份是正确的数据,还一份是异常数据。

所用到的python模板基本上也是自带的,加上操作Excel的xlrdxlwt

python操作excel

面对这样的需求,正好也让自己复习巩固下python操作excel的几个模板,记录下来,供大家参考。

操作excel我主要用xlrdxlwtXlsxWriter这三个模块,基本可以解决我遇到的所有需求。

xlrd模块只支持读取excel,不管是.xls的还是.xlsx的,可以看个简单的demo:

import xlrd

rd = xlrd.open_workbook("test.xls") #读取文件
sheets = rd.sheet_names()   #获取所有sheet名
table = rd.sheet_by_name("sheet1") #通过sheet名获取名为 sheet1 的表

#遍历excel,打印出第一列
for i in range(table.nrows):
	print(excelData.col_values(0)[i])

xlwtXlsxWriter模块,只支持写excel操作,两者各有优缺点,相对来说XlsxWriter不管从功能上还是性能上都略胜与xlwt,尤其是在支持大文件写入方面,如果数据量非常大,可以启用constant memory模式,这是一种顺序写入模式,得到一行数据就立刻写入一行,而不会把所有的数据都保持在内存中。

网上有一篇Python Excel技术比较,大家可以看下,讲的比较详细,各模块的优缺点。

image

至于写法,其实两者差不多,直接看下官方文档即可,这里以xlwt举例:

import xlwt
# 创建一个workbook 设置编码
workbook = xlwt.Workbook(encoding = 'utf-8')
# 创建一个worksheet
worksheet = workbook.add_sheet('Worksheet1')

# 写入excel
# 参数对应 行, 列, 值
worksheet.write(1,0, label = 'test')

style = xlwt.XFStyle() # 初始化样式
font = xlwt.Font() # 为样式创建字体
font.name = 'Times New Roman' 
font.bold = True # 黑体
font.underline = True # 下划线
font.italic = True # 斜体字
style.font = font # 设定样式
worksheet.write(2, 0, 'Unformatted value') # 不带样式的写入

worksheet.write(3, 0, 'Formatted value', style) # 带样式的写入

# 设置单元格宽度
worksheet.col(0).width = 3333

# 输入日期
style = xlwt.XFStyle()
style.num_format_str = 'M/D/YY' # Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0
worksheet.write(4, 0, datetime.datetime.now(), style)

#添加公式
worksheet.write(5, 0, 5) # Outputs 5
worksheet.write(5, 1, 2) # Outputs 2
worksheet.write(6, 0, xlwt.Formula('A5*B5'))
worksheet.write(1, 1, xlwt.Formula('SUM(A5,B5)')) 

#添加超链接
worksheet.write(7, 0, xlwt.Formula('HYPERLINK("http://www.google.com";"Google")'))

# 保存
workbook.save('test.xls')

后记

终于利用下班时间将这个需求搞定了,妹子很开心,但隐隐觉得没有达到她想要的,也许过几天,妹子又会乐呵呵的端着奶茶来找我了......

作者:玄冰
欢迎关注我的微信公众号和博客小程序
欢迎关注我的公众号 欢迎关注我的公众号