欢迎光临邱健蓄电池官网
服务热线
全国客服热线:

153-1370-2523

新闻中心

首页 > 新闻中心

邱健蓄电池基于恢复容量标签深度学习的退役动力电池大规模数据集重构

来源:邱健蓄电池 发布时间:2026-03-31 16:58:11 点击:

退役电池健康状态衰退的精确诊断对其安全可靠的再利用至关重要。尽管机器学习提供了有前景的解决方案,但训练模型以克服退役电池的高度异质性需要大量衰退数据,导致高昂的测试成本和巨大的能源浪费。本文揭示了从现场数据中恢复大规模高质量二次电池数据集的潜力,以辅助诊断退役电池的健康状态。通过深度学习与领域知识的无缝融合,我们实现了无需定期完全充放电校准即可对运行数据进行容量标签的精确恢复。为验证所提方法,我们对96块实际退役电池开展了大规模衰退测试,执行超过50,000次充放电循环,通过24个充放电区间模拟不同固定式储能场景。在仅获得3次二次寿命期间的容量测量数据情况下,所提方法仍能以低于30毫安时的均方根误差准确恢复容量标签。此外,基于再生数据集训练的健康诊断模型与真实数据训练的模型性能相当,误差低于5毫安时几乎可忽略不计。更重要的是,我们预计可节省至少98%的测试时间、电力及能耗,从而经济高效地生成数据集。本研究凸显了现场数据在弥补退役电池健康退化诊断关键数据缺口方面的潜力。

引言

锂离子电池清洁耐用的特性正推动电动汽车(EV)的快速发展,并为碳中和目标作出重要贡献[1,2]。受电动汽车需求持续增长的驱动,预计到2023年全球电池装机容量将超过3太瓦时[3]。然而由于不可避免的副反应,电动汽车电池会逐渐老化,当容量保持率下降至80%时必须退役[4]。同年,全球退役电池总量预计将激增至约1.4太瓦时[5]。处理急剧增长的退役电池浪潮是一项重大挑战,这不仅威胁资源可持续性,更会加剧环境污染风险。
一种颇具前景的解决方案是将退役电池重新应用于需求较低的场景,例如固定式储能系统(ESSs)。通过延长电池使用寿命,该方案有望有效缓解资源浪费与环境污染问题[6]。然而,二次利用场景与电动汽车应用场景的差异,导致需要针对退役电池在新应用中的管理策略进行重新设计,特别是在健康诊断方面。这对于基于精确健康诊断制定适宜的运行策略至关重要,可确保退役电池安全稳定运行。
数据驱动范式的兴起促使我们利用大规模数据训练机器学习模型以进行电池健康诊断[7,8]。通过规避复杂的物理建模过程,机器学习实现了基于数据提取的多维健康特征来精准诊断电池健康状况的承诺[9]。在二次寿命应用场景中,多位研究者[[10], [11], [12]]同样证实,机器学习可为储能系统中运行的6至8块退役电池提供精确的健康状态(SOH)估计。然而,这些估算结果可能具有局限性,因为上述研究尚未将机器学习应用于退役电池的大规模健康状态(SOH)估算。事实上,退役电池通常表现出由复杂使用历史导致的未知衰减模式,与新电池相比,预计会产生显著更大的衰减异质性。因此,针对退役电池的小批量物理实验很难捕捉这种异质性。与此同时,在缺乏充足且可获取的退役电池衰减数据的情况下,这种异质性直接挑战了机器学习模型的泛化Ability。因此,我们亟需大规模、多样化的可获取衰减数据来训练机器学习模型,从而克服这种异质性,如图1(a)所示。
遗憾的是,构建退役二次电池的大规模数据集往往面临巨大挑战。一方面,有限的实验资源不仅限制了大样本数据的生成,还导致高昂的测试成本与冗长的测试流程[13]。另一方面,循环测试过程本身也会造成显著的能源浪费[14]。例如,Cui等[10]对8组退役电池进行了调峰工况模拟,但即便经过15个月的测试周期仍观察到轻微容量衰减现象。Wang等[15]对86块退役电池进行了为期30个月的循环测试,生成了超过88,000次充放电循环数据。然而,该过程中产生的充放电容量被直接耗散。毫无疑问,以低成本从实验室获取大规模高质量的第二寿命数据集具有相当高的挑战性。鉴于机器学习在退役电池健康状态退化诊断中的应用日益广泛,而训练这些模型所需数据仍存在缺口,这一任务正变得愈发重要。
为此,我们拟从二次利用现场数据中恢复大规模高质量退化数据集,如图1(b)所示。相较于实验室数据,现场积累的数据具有两大关键特征:其一,得益于电池管理系统(BMS)对电压、电流等现场数据的高频采集[16],结合云平台的不间断存储功能[17,18],积累的运行数据量远超实验室生成的退化数据。其次,这些数据在实际运行过程中产生,避免了物理实验中的能源浪费[19]。近期由B2U Storage Solutions部署的代表性项目已展示出大规模数据生成的巨大潜力——超过580辆电动汽车的退役电池被改造应用于光伏储能领域[20]。假设电池管理系统(BMS)以工业标准承诺的≤1000毫秒采样间隔进行实时监测,预计每日可积累数十TB级数据[21]。这启发了我们思考如何合理复用这些现场数据,为机器学习提供丰富多样的训练样本,从而规避昂贵物理实验在应对异质性挑战时面临的数据局限。
然而,面临的一个棘手问题是:再利用领域积累的运行数据普遍缺乏容量标签[22]。退役电池的容量仅在再利用阶段或偶发维护时进行测量,由于维护周期跨度较长,导致容量标定结果严重匮乏[23]。容量标签的不可获得性从根本上阻碍了"可直接将现场复用数据转化为高质量退役电池数据集"这一假设的实现,该数据集本可用于训练机器学习模型以诊断健康度衰减[24]。因此,亟需开发容量标签恢复方法,从而为将复用现场数据转化为高质量、大规模的退役二次利用电池数据集提供可行且有效的解决方案。
本研究提出通过领域知识驱动的深度学习方法,从无标注的二手电池现场数据中恢复大规模高质量的动力电池二次寿命数据集。该方法能够从极少量标注数据中高保真地恢复每个充放电片段的容量标签,从而利用罕见标注的现场数据解决物理实验无法攻克的大规模数据生成难题。本研究的主要贡献如下:
  • 1)
    为实现从二手现场数据中恢复容量标签,我们采用与容量高度相关的健康特征作为代理标签来监督深度神经网络(DNN)的学习,从而迫使DNN从输入的充放电片段中学习与容量衰减相关的领域知识。随后,训练完成的DNN仅需每个退役电池的三个真实容量标注样本即可进行迁移学习。这实现了容量恢复任务的快速适配,并以高保真度生成剩余充放电区段的容量标签。
  • 2)
    鉴于独立估计器在异构数据挑战下可能产生极端容量恢复误差,我们引入一个用于拟合电池退化轨迹的经验模型作为第二估计器。该经验模型同样采用与深度神经网络(DNN)输入相同的三组标记数据进行建模。随后,通过卡尔曼滤波将经验模型与DNN融合,以提高容量标签恢复的稳定性。
  • 3)
    所提出的方法在模拟24种储能系统运行场景的二阶寿命退化数据集上得到验证,该数据集包含96块退役电池及超过50,000次循环。结果表明,该方法能够高保真地还原每块退役电池在整个二阶寿命退化轨迹中的容量标签,其均方根误差(RMSE)小于30毫安时。此外,基于复原数据训练的最大容量估计模型,其性能与真实数据训练的模型相当,误差增幅可忽略不计(低于5毫安时)。技术与经济分析结果表明,在大规模退役电池数据处理过程中,所提方法可节省98%以上的时间、电力成本及能耗。