所提出的WTX–CBO混合架构旨在提高电动汽车锂离子电池剩余使用寿命预测的准确性、稳健性和泛化能力。该框架集成了三个关键组件:(i) 数据预处理与分解模块,(ii) 预测建模模块,以及 (iii) 优化模块。每个模块都针对电池健康状态估计的关键方面,涵盖了多尺度特征提取与长期时序学习,以及自适应超参数优化与残差误差校正。
图1所示的端到端预测工作流程概述了本研究采用的完整处理流程,从电池循环测量和容量衰减数据的获取开始。预处理阶段通过缺失值修正、异常值处理、特征选择和多尺度小波分解确保数据完整性。时间序列分割实现了面向剩余使用寿命(RUL)估计的序列到目标学习。 outlines the full processing pipeline adopted in this study, beginning with the acquisition of battery cycling measurements and capacity degradation data. The preprocessing stage ensures data integrity through missing value correction, outlier handling, feature selection, and multiscale wavelet decomposition. Time-series segmentation enables sequence-to-target learning for RUL estimation [33].

所提出的WTX–CBO电池剩余使用寿命预测框架的整体工作流程。
在训练过程中,Transformer 捕捉时间退化行为和长距离依赖关系,而 XGBoost 则作为残差细化模块,补偿非线性估计偏差。同时,CBO 对超参数空间进行高效的全局探索,避免了传统启发式方法中常见的过早收敛问题。在测试阶段,该框架的泛化能力通过此前未见过的电池老化轨迹进行评估,从而提供适用于实际电动汽车电池管理系统、可靠、稳健且可扩展的剩余使用寿命预测。34-36].
从数学角度而言,该模型遵循三阶段工作流程:
这种混合公式能够有效建模多尺度电池退化行为,结合了基于小波的特征提取、注意力驱动的时间学习以及残差增强,从而提高准确性和鲁棒性。由此产生的WTX–CBO框架为电动汽车电池管理系统中的实时RUL估计提供了一种灵活高效的解决方案。
NASA PCoE 锂离子电池老化数据集提供了高分辨率的充放电测量数据,捕捉了在不同负载和温度条件下的完整退化轨迹。四个广泛使用的电池——B0005、B0006、B0007 和 B0018——包含同步的电压、电流、温度和容量信号。在本研究中,电池 B0005–B0007 用于训练和验证,而 B0018 则专门保留用于测试,以评估对先前未见过的老化行为的外推能力。
CALCE 老化数据集(S2-35、CS2-36、CS2-37、CS2-38)提供了在不同放电速率、温度设置和加速应力条件下生成的额外退化曲线。记录的特征包括循环过程中的端电压、电流、温度和容量衰减。在此,电池 S2-35、CS2-36 和 CS2-37 用于训练和验证,而 CS2-38 被指定为测试电池,以评估模型在异质退化模式下的鲁棒性。
预处理阶段确保模型接收一致、去噪且归一化的电池健康信号。原始锂离子电池循环数据——通常在每个充放电循环或精细测量间隔进行采样Δt——包含端电压、电流、温度和放电容量等变量。工作流程包含四个主要步骤:数据清洗、归一化、特征选择和基于小波的多尺度分解 [42].
电池循环数据可能包含缺失测量值、传感器噪声或由热效应、不一致的充电条件或测量漂移引起的突变。使用样条插值和3点移动平均滤波器修正缺失或噪声样本。通过四分位距(IQR)方法去除异常值,以抑制电压尖峰或电流传感伪影等瞬态异常。
每个特征通过最小-最大归一化缩放至[0,1],其中是归一化后的值。这种归一化增强了数值稳定性,提高了训练效率,并加速了后续深度学习阶段的收敛[
x′=x−xminxmax−xmin,其中x′2.2.2. 特征选择34].
直接和上下文退化指标均被保留。直接变量(电压、电流、温度和容量)能即时反映电化学行为和老化进程,而上下文变量(循环次数、充放电时长和荷电状态曲线)则能增强在不同工况和热条件下的鲁棒性。
为了识别用于电池健康估计的最具信息量的信号,计算候选特征与退化目标(SOH/RUL)之间的皮尔逊相关系数和互信息分数。所选特征被串联成输入向量X(t)∈Rd [31].
为了捕捉多尺度退化动态,归一化的电池信号通过DWT进行分解:
X(t)=AN(t)+∑j=1NDj(t),其中AN(t)表示反映长期容量衰减和缓慢电化学老化的低频分量,而Dj(t)捕捉与瞬态电压下降、电流变化和热响应相关的高频波动。
选择具有强时频局部化特性和已被证实能有效表示非平稳电池退化信号的Daubechies (db4) 小波,其分解级数为N=4DWT的多分辨率结构与锂离子电池中关键电化学现象的时间尺度自然契合,能够提供具有物理可解释性的特征表示。低频近似系数32].
小波分量的物理意义与可解释性。能够捕捉固体电解质界面层(SEI)生长、长期容量衰减和渐进欧姆电阻增加等缓慢的累积退化过程。相比之下,高频细节系数AN(t)强调包括锂镀层、热失控、电压迟滞波动以及微裂纹诱发的瞬态在内的短时事件。通过将长期漂移与快速不稳定性模式分离,DWT 生成的结构化信号不仅提高了预测精度,还确保后续的深度学习模块基于具有直接电化学相关性的特征运行,而非抽象的潜在表示。Dj(t) emphasize short-duration events including lithium plating, thermal excursions, voltage hysteresis fluctuations, and micro-crack-induced transients. By separating long-term drift from rapid instability modes, the DWT produces structured signals that not only enhance predictive accuracy but also ensure that subsequent deep learning modules operate on features with direct electrochemical relevance rather than abstract latent representations.
所有经过小波分解的电池退化序列被重新组装成一个张量X∈RT×d,其中T表示回溯窗口长度,d表示所选特征通道的数量。这种结构化的表示方式使得Transformer能够处理多通道时序输入,并学习退化演变过程,涵盖短期波动和长期老化趋势。
最终数据集采用80-10-10的比例,通过向前滚动(时间顺序)策略划分为训练、验证和测试子集,确保未来退化数据不会泄露到模型训练中[35].
该预处理与分解模块提升了信号质量,保留了电池退化行为的物理可解释性,并生成了多尺度特征表示,增强了Transformer捕捉短期波动和长期老化动态的能力,从而实现准确的剩余使用寿命预测。
预测模块构成了所提出的WTX–CBO框架的核心预测阶段。它集成了两个互补组件——用于捕捉长期时间退化依赖关系的编码器-解码器Transformer和用于残差校正的XGBoost集成模型。这种双阶段架构能够建模锂离子电池行为中既有的渐进老化轨迹和局部非线性退化模式,确保在各种运行和循环条件下具有增强的鲁棒性和准确性[34].
Transformer利用自注意力机制并行处理完整序列,从而捕捉退化演变和长期时间依赖关系,缓解了在LSTM和BiLSTM等循环架构中观察到的梯度消失限制。
给定多变量小波分解输入X∈RT×d首先应用位置编码以保留时间顺序:
PE(pos,2i)=sin(pos100002i/dmodel)编码后的特征随后由包含多头注意力和前馈子模块的堆叠编码器层进行处理。注意力操作计算电池退化特征之间的上下文相关性,具体如下:
Attention(Q,K,V)=softmax(QK⊤dk)V,其中Q, K,以及V分别表示查询、键和值矩阵,而dk是键的维度。编码器学习电压、电流、温度和容量衍生表示之间的交互,而解码器利用编码后的记忆,在历史老化模式和Transformer潜在状态的条件下估计剩余使用寿命。
Transformer注意力的可解释性。自注意力机制使Transformer能够关联降解轨迹中相距较远的片段,使其既能建模SEI生长和阻抗上升等缓慢的电化学过程,又能捕捉与锂沉积或温度诱导应力相关的快速波动。由此产生的注意力权重通过识别对预测贡献最大的时间片段和小波子带,提供了可解释性。在实践中,注意力图始终强调温度升高、电压迟滞和内阻增加的时期——这些模式直接对应于已记录的电化学老化机制[36].
虽然变换器能够有效捕捉长期退化趋势和时间依赖关系,但由于电化学、热力学和运行变量之间的非线性相互作用,预测残差可能依然存在。为缓解这一问题,采用 XGBoost 回归层来精炼变换器的输出。
XGBoost 通过迭代最小化残差损失来构建提升决策树的集成:
L(t)=∑i=1nl(RULi,RUL^i(t−1)+ft(xi))+Ω(ft),其中ft表示第t棵回归树,l(⋅)是损失函数,且Ω(ft)惩罚模型复杂度。混合预测结果随后通过以下方式获得
RUL^final=RUL^Trans+ϵXGB,其中ϵXGB表示学习到的残差校正项。这一细化步骤增强了预测稳定性,降低了在异构充放电曲线和温度条件下的方差,并提高了对未见电池老化模式的泛化能力 [37].
最终预测的剩余使用寿命信号通过聚合细化后的小波分量进行重构:
RUL^final(t)=AN*(t)+∑j=1NDj*(t),其中AN*(t)和Dj*(t)分别表示经过Transformer预测和XGBoost细化后的重构近似系数和细节系数。
这一重构步骤同时恢复了长期退化趋势和短期老化波动,确保与电池健康演化在物理上的一致性,并保留了有意义的电化学退化特征。
通过将注意力驱动的时序建模与梯度提升残差精炼相结合,预测模块提供了稳健且高精度的电池剩余使用寿命(RUL)预测。这种混合架构能够有效捕捉缓慢的容量衰减和复杂的非线性瞬态退化模式,从而实现智能电池管理、预测性维护以及电动汽车的安全运行[38].
为了提高收敛稳定性和预测鲁棒性,所提出的WTX–CBO框架集成了基于CBO的启发式优化策略。该优化器模拟台球在混沌动态系统中的运动,实现了全局探索与局部开发之间的平衡权衡。这种特性使得CBO在用于电池RUL估计的复杂混合深度学习模型的超参数调优中具有极高的效率[39]. 伪代码概述了用于剩余使用寿命(RUL)预测的所提WTX–CBO管道。首先,多变量电池测量数据经过数据清洗和归一化处理,随后通过离散小波分解提取多尺度时序特征。接着构建滑动窗口以形成监督学习序列。该模型联合利用Transformer编码器进行深度时序表征学习,以及XGBoost回归器进行稳健的非线性映射以预测RUL目标值。两个组件的超参数被编码为单个搜索向量,并通过CBO进行优化,该优化过程基于混沌粒子动力学迭代演化候选解,以最小化验证集均方根误差(RMSE)。收敛后,使用最优参数重新训练组合模型,并对未知数据生成RUL预测。最终使用标准回归指标评估性能。
用于电池剩余使用寿命估计的混合深度和集成模型严重依赖于精心调整的超参数,如学习率、嵌入大小、dropout比率、注意力头数和提升深度。传统的基于梯度的优化器(如Adam或RMSProp)能有效优化网络权重,但在搜索空间中仅进行局部操作,因此在面对高度非线性和多模态退化模式时,容易陷入次优收敛。所提出的WTX–CBO框架的完整训练和优化流程总结于算法S1(见补充数据).
另一方面,PSO和GA等启发式群体方法具备全局搜索能力,但在高维配置中往往面临过早收敛和探索能力有限的问题。CBO通过向候选解引入混沌动态扰动来克服这些局限,从而实现持续探索、摆脱局部最小值,并加速收敛至全局最优超参数集 [43].
每个台球代理代表一个候选超参数向量Xi=[xi1,xi2,…,xid]治理模型配置(例如学习率、嵌入维度、注意力头数和提升深度)。在限定的搜索空间内Ω⊂Rd,其运动演化为:
Xit+1=Xit+μvit+λϕ(Xit),其中μ是惯性系数,λ控制混沌扰动强度,而ϕ(⋅)是一种非线性混沌台球映射,用于多样化探索。
速度更新如下:
vit+1=ωvit+r1(Pi−Xit)+r2(G−Xit),其中Pi和G表示个体最优和全局最优超参数向量,ω是一个阻尼因子,而r1,r2∈(0,1)是随机混沌系数。
CBO的鲁棒性特性。CBO中的混沌扰动项促进了持续探索,并减轻了对初始化的敏感性,使优化器即使在高维搜索空间中也能摆脱局部最小值。这一特性还增强了对训练数据中噪声和不规则性的鲁棒性,因为混沌动力学防止收敛到由瞬态扰动引起的虚假最小值。这些特性使CBO非常适合混合深度学习管道中的元参数优化。
CBO优化的目标函数定义为:
minΘL(Θ)=1N∑i=1N(RULi−RUL^i)2+α‖Θ‖22,其中Θ包含可训练参数和元参数,以及α一个L2正则化项,用于控制模型复杂度并防止过拟合 [43].
CBO 与 Adam 优化器协同运行:CBO 执行全局超参数搜索,而 Adam 通过梯度下降对模型权重进行局部微调。在每次迭代中,候选超参数集Θ*被输入到Transformer-XGBoost架构中,然后通过反向传播和提升树残差学习进行优化。一旦相对改进幅度L(Θ)持续低于阈值ε连续K次迭代,优化过程即终止,表明已收敛。
为了严格评估所提出的剩余使用寿命(RUL)估计框架的预测能力,采用了全面的统计指标集。这些指标量化了绝对偏差、平方误差惩罚、预测方差解释和相对估计精度。设RULi和RUL^i表示样本i的真实和预测RUL值,且N表示测试样本的数量。
平均绝对误差(MAE)量化了绝对估计误差的平均幅度,捕捉了与真实电池续航时间的典型偏差,且不考虑误差方向。
均方误差(MSE)对较大的误差惩罚更严格,能够对因突发退化事件导致的严重估计偏差保持敏感。
均方根误差(RMSE)以与剩余使用寿命(RUL)相同的单位表示预测偏差,从而能够直观地以剩余循环次数或运行小时数来解释。
其中RUL¯表示真实剩余使用寿命的均值。R2衡量模型解释的剩余使用寿命方差的比例。
MAPE 表示平均相对误差百分比,能够实现不同老化模式和数据集之间的直接比较。
采用了两阶段超参数优化流程,以平衡剩余使用寿命估计精度与计算效率。
首先进行了一次粗略的网格搜索,以确定Transformer和XGBoost组件的可行超参数范围。基于验证准确率和在退化曲线上的稳定性确定的最佳值总结在表2和3.
Optimal transformer hyperparameters for RUL estimation after grid search.
| Parameter | Tested Range | Selected |
|---|---|---|
| Learning rate | {1e−4, 5e−4, 1e−3} | 5e−4 |
| Dropout rate | {0.1, 0.2, 0.3} | 0.2 |
| Feed-forward dimension | {128, 256, 512} | 256 |
| Model dimension dmodel | {64, 128, 256} | 128 |
| Attention heads | {2, 4, 8} | 4 |
| Encoder layers | {2, 3, 4} | 4 |
网格搜索后用于RUL精炼的最优XGBoost超参数。
| 参数 | 测试范围 | 已选 |
|---|---|---|
| 子采样率 | {0.6, 0.8, 1.0} | 0.8 |
| 学习率 | {0.01, 0.05, 0.1} | 0.05 |
| 最大深度 | {3, 5, 7} | 5 |
| 树的数量 | {100, 200, 300} | 200 |
网格搜索初始化后,CBO通过最小化RUL预测的验证RMSE来优化选定的超参数。CBO利用混沌运动动力学动态扰动候选配置,实现了高效探索,并避免了在高维退化建模中的过早收敛。所采用的CBO配置报告在表4
用于RUL预测超参数精炼的CBO配置。
| 参数 | 值 |
|---|---|
| 触发移动系数(ω) | 0.9 |
| 加速系数 (a) | 1.0 |
| 最大迭代次数 | 100 |
| 人口规模 | 30 |
| 终止准则 | 收敛或最大迭代次数 |
电话:153-1370-2523
美国邱健蓄电池集团总部