锂电池 SOH 估算 —— 健康特征提取与筛选
一、核心主题
围绕 18650 锂电池 SOH(State of Health,健康状态)估算,重点开展健康特征参数的提取、筛选及初步建模验证,最终通过优化输入特征提升 SOH 估算精度。
二、关键术语定义
(一)SOH(State of Health):电池健康状态
-
定义:表征锂电池当前性能相对于初始性能的衰减程度,是衡量电池老化状态的核心指标。
-
量化方式:通常以 “当前最大可用容量 / 初始额定容量 ×100%” 表示,取值范围为 0%-100%。
-
示例:新电池 SOH 约为 100%,当容量降至初始额定容量的 70% 时(SOH=70%),一般认为电池达到寿命终点,停止测试。
-
核心作用:无法直接测量,需通过电压、电流、温度等间接特征参数估算,是电池管理系统(BMS)的关键输出。
(二)样本与样本值
-
样本:本次研究中,“样本” 指单节电池在一次完整充放电循环中记录的所有数据集合(包含电压、电流、温度随时间变化的序列数据)。
-
样本值:指单个样本中某一参数的具体测量数值,分为两类:
-
原始样本值:充放电过程中实时采集的基础数据,如某一时刻的电压值(单位:V)、电流值(单位:A)、温度值(单位:℃)、时间值(单位:s)。
-
衍生样本值:通过原始样本值计算得到的特征参数值,如电压差(单位:V)、充电速率(单位:V/s)、平均温度(单位:℃)等,是后续相关性分析的直接对象。
-
-
样本量:指参与分析的充放电循环总次数,例如选取 B0005 电池的 35 次、55 次、75 次、95 次等循环数据,样本量即为对应的循环次数总和。
(三)其他关键术语
-
协同对(C):在两组样本(如特征参数序列 x 和 SOH 序列 y)中,任意两个样本的排序方向一致的组合。例如,样本 1 的 x1>x2 且 y1>y2,或 x1<x2 且 y1<y2,即为 1 个协同对。
-
异协同对(D):任意两个样本的排序方向相反的组合。例如,样本 1 的 x1>x2 但 y1<y2,或 x1<x2 但 y1>y2,即为 1 个异协同对。
-
秩次:将一组样本值按从小到大(或从大到小)排序后,每个样本值对应的位次(如数值 [2,5,3] 的秩次为 [1,3,2]),用于斯皮尔曼、肯德尔相关系数的计算。
-
过拟合:模型在训练数据上表现优异,但对新的未见过的数据预测精度大幅下降的现象,多由输入特征维度过高、样本量不足导致。
三、研究背景与实验基础
(一)核心前提
电池 SOH 受温度、充放电率等因素直接影响,无法直接测量,需挖掘能间接表征电池性能变化的健康特征参数,作为 SOH 估算的输入依据。
(二)实验对象与测试条件
-
实验电池:NASA 数据集中的 18650 锂电池(含 B0005、B0006、B0007 等,以 B0005 为主要验证对象)。
-
充电流程:1.5A 恒流充电至4.2V(18650 锂电池标准充电截止电压,修正原 3.2V 的笔误),随后恒压充电至充电电流降至 20mA(原始样本值实时采集)。
-
放电流程:2A 恒流放电至端电压达到截止电压(B0005 为 2.7V,原始样本值实时采集)。
-
停止条件:当电池容量降至初始额定容量的 70% 时(SOH=70%),终止测试。
四、健康特征分类与提取方向
健康特征主要分为四类,均基于电池充放电阶段的参数变化挖掘老化规律,具体提取方向如下:
(一)电压特征
-
核心逻辑:电池老化会导致充放电电压曲线显著变化,且老化与内阻增大正相关,电压变化可间接反映内阻及 SOH 状态。
-
曲线规律:随循环次数增加,充放电电压曲线整体前移,恒流充放电阶段达到截止电压的时间缩短。
-
可提取参数(衍生样本值):电压曲线斜率、初始充电电压、放电阶段电压差、平均电压、方差电压、3.9V 至特定时间(如 1000 秒)的电压差值、3.9V 至截止电压(4.2V)的充电速率等。
(二)电流特征
-
核心逻辑:不同循环次数下,电流曲线的关键节点(如恒流 - 恒压充电模式切换点)会随电池老化偏移,可间接表征老化状态。
-
曲线规律:充电时电流曲线由平直线转为曲线的节点、放电时关键电流值,随循环次数增加呈现明显差异。
-
可提取参数(衍生样本值):充放电阶段电流差、平均电流、初始电流、恒压充电阶段特定时间内(如 500 秒)的电流差值等。
(三)温度特征
-
核心逻辑:电池工作时的电化学反应会产生热量,温度变化规律与老化程度相关,可通过温度参数挖掘老化规律。
-
曲线规律:充电时温度从室温升至峰值后下降,放电时温度呈类似变化;随循环次数增加,不同老化程度电池的温度峰值位置差异显著。
-
可提取参数(衍生样本值):平均温度、温度峰值、充放电阶段等时间内的温度差等。
(四)其他健康特征
-
包含类型:容量单调分析法、差分电压、超声波实验等。
-
应用说明:虽可用于 SOH 估算,但相比电压、电流、温度,缺乏实际可测性(难以通过常规传感器采集原始样本值),未作为优先选择。
五、特征筛选方法与结果
(一)筛选必要性
- 避免高维数据降低模型训练效率,减少过拟合风险,确保输入特征与 SOH 的强相关性,提升估算精度。
(二)筛选方法:三种相关系数分析
相关系数用于衡量变量(健康特征,即衍生样本值)与 SOH(目标变量,即 SOH 量化值)的相关程度,取值范围为 [-1,1],0.8-1.0 为极强相关,数值越低相关性越弱。
| 相关系数类型 | 核心公式 | 适用场景与特点 |
|---|---|---|
| 皮尔逊相关系数(Pearson) | 注:(x_i) 为第 i 个样本的特征衍生值,(y_i) 为第 i 个样本对应的 SOH 值,(\bar{x})、(\bar{y}) 为样本均值,n 为样本量(循环次数) | 适用于线性关系、正态分布的连续数据,衡量线性相关性 |
| 斯皮尔曼相关系数(Spearman) | 注:(x_i)、(y_i) 含义同上,(d_i) 为 x 与 y 的秩次差,n 为样本量 | 非参数方法,不要求正态分布,适用于非线性关系或有序数据,衡量单调相关性 |
| 肯德尔相关系数(Kendall) | 注:C 为协同对数量,D 为异协同对数量,n 为样本量 | 非参数方法,对异常值稳健,基于秩次顺序,适用于样本量小或分布不明的数据 |
(三)筛选过程与结果
-
参考论文:《基于特征健康特征参数的锂电池 SOH 和 RUL 联合预测方法》,初始设置 3 个候选特征(衍生样本值)。
-
候选特征与筛选结果:
- 恒流充电过程中 3.9V 至 1000 秒的电压差值(健康特征一):三种相关系数均≥0.8,极强相关,保留。
- 恒流充电过程中 3.9V 至截止电压(4.2V)的充电速率(健康特征二):三种相关系数均≥0.8,极强相关,保留。
- 恒压充电开始至 500 秒内的电流差值(健康特征三):相关系数约 0.2,弱相关,剔除。
-
结论:确定 2 个高相关性特征作为初始输入,SOH 作为输出,构建 “特征输入 - SOH 输出” 的基础框架。
六、模型验证与优化计划
(一)初步验证:LSTM 模型
-
输入:筛选后的健康特征一、二(衍生样本值)。
-
输出:SOH(量化值)。
-
验证对象:NASA 数据集 B0005 电池。
-
样本数据:选取 B0005 电池多次充放电循环的样本(如 35 次、55 次、75 次、95 次等),提取对应特征值与 SOH 值作为训练数据。
-
结果:经 200 次迭代后,模型预测 SOH 与实际 SOH 的曲线拟合度较好,验证了筛选方法的可行性。
(二)后续优化计划
-
目标:增加 2-3 个高相关性输入特征,进一步提升 SOH 估算精度。
-
候选特征:初始电压、电压斜率、双差电压、双差电流、峰值温度等(均为衍生样本值)。
-
筛选方式:通过斯皮尔曼等相关系数分析(修正原 “GPT” 的笔误,贴合研究方法),选取相关性≥0.8 的特征加入输入。
-
建模方向:补充特征后,构建神经网络电池老化模型,优化估算精度。
七、核心逻辑梳理
提取充放电阶段的电压 / 电流 / 温度原始样本值 → 计算衍生样本值作为健康特征 → 用三种相关系数筛选强相关性特征(≥0.8) → 构建 “特征输入 - SOH 输出” 框架 → 经 LSTM 模型验证可行性 → 补充高相关性特征优化输入 → 提升 SOH 估算精度。