Python 操作 Excel 条件格式指南

0 阅读6分钟

周一早上九点,你的邮箱被各种报表塞满。

打开财务发来的季度销售数据,几千行数字挤在屏幕上,眼睛扫过去一片黑压压。老板在旁边等着汇报,问你这个季度哪个产品卖得最好、哪些区域掉得厉害。你拿着鼠标划来划去,半天找不出个所以然。

这场景,但凡用Excel干过活的人都懂——数据有了,但看不见。

条件格式就是干这个用的。它能让数字“开口说话”:高于平均值的自动标绿,低于警戒线的自动飘红,重复值、排名、异常点一眼扫过去清清楚楚。但问题来了,每月、每周甚至每天都要手动重复这些操作,时间全耗在“格式化”上了。

Python能帮你解决这个麻烦。

用代码操作Excel条件格式,本质上就是把你手动点鼠标的步骤写成脚本。数据更新了,脚本跑一遍,格式自动生成。市面上主流的几个库——openpyxl、xlsxwriter、Spire.XLS——各有各的脾气,选对了工具,事半功倍。

一、openpyxl:最接地气的全能选手

openpyxl是处理Excel最常用的库,读写都支持,对条件格式的支持也比较完善。它的设计思路很符合直觉:先定规则,再上格式。

比如你想把成绩表里不及格(小于60分)的单元格标红,代码可以这么写:

from openpyxl import load_workbook
from openpyxl.styles import PatternFill
from openpyxl.formatting.rule import CellIsRule

wb = load_workbook('成绩表.xlsx')
ws = wb.active

# 定义红色填充
red_fill = PatternFill(start_color='FF0000', end_color='FF0000', fill_type='solid')

# 添加条件格式规则:单元格值小于60
ws.conditional_formatting.add('B2:B100', 
                              CellIsRule(operator='lessThan', 
                                        formula=['60'], 
                                        fill=red_fill))

wb.save('成绩表_格式化.xlsx')

这段代码干的事,和你手动点“条件格式>突出显示单元格规则>小于”一模一样,区别在于——下次再来100份报表,它也能一秒干完。

openpyxl支持的规则类型不少:CellIsRule(基于值)、FormulaRule(基于公式)、ColorScaleRule(色阶)、IconSetRule(图标集)、DataBarRule(数据条)都有。想做复杂点的逻辑,比如“既要大于平均线,又要属于前10%”,用公式规则就能搞定。

有个坑得提醒你:openpyxl在读取带条件格式的现有文件时,规则信息可能会丢失。所以用它创建格式没问题,但别指望完美读取别人设好的规则。

二、xlsxwriter:写报表的一把好手

如果你只需要“生成”报表,不需要修改已有文件,xlsxwriter是更轻量级的选择。它专注于写入,功能纯粹,性能也不错。

xlsxwriter的语法有点不一样,用的是字典传参:

import xlsxwriter

workbook = xlsxwriter.Workbook('销售报表.xlsx')
worksheet = workbook.add_worksheet()

# 准备数据
data = [320450280490350420380]
worksheet.write_column('A1', data)

# 定义两种格式
green_format = workbook.add_format({'bg_color''green'})
red_format = workbook.add_format({'bg_color''red'})

# 设置条件格式:大于400标绿,小于等于400标红
worksheet.conditional_format('A1:A7', {'type''cell',
                                        'criteria''>',
                                        'value'400,
                                        'format': green_format})
worksheet.conditional_format('A1:A7', {'type''cell',
                                        'criteria''<=',
                                        'value'400,
                                        'format': red_format})

workbook.close()

xlsxwriter最实用的功能之一是配合pandas用。你拿pandas做完数据处理,直接用pd.ExcelWriter指定xlsxwriter引擎,然后调用条件格式方法,数据分析+报表生成一条龙。

import pandas as pd

df = pd.DataFrame({'销售额': [320450280490350]})

writer = pd.ExcelWriter('报表.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='销售数据', index=False)

workbook = writer.book
worksheet = writer.sheets['销售数据']

# 对B列(销售额)应用三色阶
worksheet.conditional_format('B2:B6', {'type': '3_color_scale'})

writer.close()

xlsxwriter不支持读取已有文件,也不能修改。但如果你是从零开始建报表,它够快、够稳、够干净。

三、Spire.XLS:商业级功能的代表

Spire.XLS是个商业库,功能覆盖面比前两个更广。它的API设计更接近Excel本身的逻辑,支持的操作也更多——比如设置公式条件、处理跨工作表引用、精细化控制格式选项。

有些场景下,用前两个库实现起来比较费劲,比如“隔行变色”这种需求。用Spire.XLS可以写得很直白:

from spire.xls import *
from spire.xls.common import *

workbook = Workbook()
workbook.LoadFromFile("数据.xlsx")
sheet = workbook.Worksheets[0]

# 添加条件格式
conditionalFormat = sheet.ConditionalFormats.Add()
conditionalFormat.AddRange(sheet.Range[21, sheet.LastRow, sheet.LastColumn])

# 偶数行设白色背景
condition1 = conditionalFormat.AddCondition()
condition1.FirstFormula = "=MOD(ROW(),2)=0"
condition1.FormatType = ConditionalFormatType.Formula
condition1.BackColor = Color.get_White()

# 奇数行设浅灰背景
condition2 = conditionalFormat.AddCondition()
condition2.FirstFormula = "=MOD(ROW(),2)=1"
condition2.FormatType = ConditionalFormatType.Formula
condition2.BackColor = Color.get_LightGray()

workbook.SaveToFile("隔行变色.xlsx", ExcelVersion.Version2016)
workbook.Dispose()

Spire.XLS还支持一些“开箱即用”的高级功能:Top/Bottom规则、高于/低于平均值、介于两个数之间。这些在Excel里是内置选项,用openpyxl得绕个弯,用Spire.XLS直接调方法就行。

不过它是收费库,有30天试用期。项目预算够、追求开发效率的情况下可以考虑。

四、怎么选?看你的场景

三个库没有绝对的好坏,关键看你想干什么。

openpyxl最适合“既要读又要写”的场景。你需要修改现有文件、保留原有内容、同时添加新格式,用它最稳妥。社区活跃,遇到问题好搜答案。

xlsxwriter适合“纯生成”的场景。跑数据分析脚本,自动输出带格式的报表,发给老板或客户。性能好,文件体积控制得也不错。配合pandas用,体验很顺。

Spire.XLS适合复杂格式需求的场景。要做多条件嵌套、大量使用公式规则、或者嫌自己造轮子太麻烦。商业环境、预算允许的情况下,能省不少开发时间。

五、几个实战技巧

  1. 公式规则里,引用要写对。在条件格式里用公式,注意相对引用和绝对引用。=A1>100是针对每个单元格判断,=A$1>100就变成全跟第一行比。
  2. 规则有顺序。Excel按规则添加顺序执行,后面的规则可能覆盖前面的。代码里添加规则的顺序,就是最终生效的顺序。
  3. 别贪多。一个工作表里规则太多,文件打开会卡。能用一两条规则解决的,别绕复杂逻辑。
  4. 先清空再添加。如果反复运行脚本,记得先删掉旧规则再添新的,不然会叠加上去,结果乱套。

回到开头那个周一早上的场景。

用Python写完条件格式脚本之后,你只需要把新季度数据拖进文件夹,双击运行。再打开Excel时,销售冠军已经标成绿色,下滑区域标成橙色,异常值标成红色。老板指着屏幕问“这个月怎么回事”,你三秒就能找到问题出在哪。

那多出来的半小时,不用再对着黑压压的数字发呆。