欢迎光临邱健蓄电池官网
服务热线
全国客服热线:

153-1370-2523

新闻中心

首页 > 新闻中心

邱健蓄电池HA-LLM:面向车云协同电池健康态势感知的领域知识增强大语言模型

来源:邱健蓄电池 发布时间:2026-03-17 11:03:47 点击:

电动汽车牵引电池的精确健康状态(SOH)评估对安全性和可靠性至关重要,然而实际运行中电池表现出非线性老化特性及显著的车辆间分布偏移。大型语言模型(LLMs)虽能提供可迁移的先验知识以提高样本效率,但其预训练基于离散文本数据,导致与连续且受物理约束的电池信号间存在表征鸿沟,且其生成式推理可能产生物理不一致的数值输出。本研究提出电池领域知识增强的健康感知LLM框架(HA-LLM)。该框架通过异构模态语义对齐方法将重采样充电电流序列映射至LLM嵌入空间,生成物理一致的向量表征;同时采用信息瓶颈启发的前缀自适应机制注入电池退化先验知识,在保留预训练主干网络通用推理能力的前提下实现领域适配。为降低幻觉风险,一个不确定性感知模块通过蒙特卡洛采样估算预测不确定性,并触发与物理一致性估计器的选择性替换。该框架使用车云平台上100辆量产车辆的一年期现场数据,以及针对未见车型的独立电池拆解与台架容量校准进行验证。HA-LLM在强调跨车辆泛化能力的少样本与零样本评估中持续优于强基线模型,并保持稳健性能。

图文摘要

Graphical abstract Image 1
  1. 下载:下载高分辨率图像(344KB)
  2. 下载:下载全尺寸图像

引言

全球向清洁能源和碳中和的转型加速了电动汽车(EV)的普及。作为电动汽车的主要能源,牵引电池的健康状态(SOH)直接决定了车辆的续航里程和安全性[1]。然而,电池性能衰退的非线性和时变特性,加之多因素耦合效应,使得在实际运行条件下实现高精度且具有泛化能力的SOH评估面临重大挑战[2]。
现有SOH评估方法主要遵循两种技术路线:基于模型的方法和数据驱动方法[3][4]。基于模型的方法采用等效电路模型或电化学模型描述衰减机制[5][6]。例如Bian等[7]通过基于模型的电压重构技术重建增量容量曲线,并在多种电池类型上验证了该方法的鲁棒性。Kim等[8]提出了一种基于二阶RC等效电路模型的SOH估算方法,该方法采用结合粒子群优化的混合滤波器进行参数整定。[9]的研究系统评估了多种等效模型与辨识策略的组合。尽管这些方法具有较强可解释性,但依赖于精确的先验知识和复杂的参数辨识流程,且难以适应全生命周期中的参数漂移现象[10]。
数据驱动方法通过从历史数据中学习统计关联来建立健康状态映射,从而避免显式的物理建模[11][12]。早期研究多采用支持向量机(SVM)和提升方法等传统技术[13][14],后期则引入基于Shapley值的特征选择与集成学习以提升稳定性。Ye等[15]提出了一种基于区间容量的估计方法,该方法通过Shapley分析识别关键特征,并采用CatBoost算法进行精确预测。Zhang等[16]区分了多种运行工况,并提取各场景下的对应特征,随后构建了基于集成学习的融合模型。随着深度学习的发展,序列建模方法在健康状态估计中展现出更强的特征提取能力[17]。长短期记忆网络(LSTMs)[18][19]、卷积神经网络(CNNs)[20][21]以及Transformer架构[22][23][24]及其变体,因其强大的表征学习能力而得到广泛应用。然而,现有研究大多局限于单一模态信息,且主要基于实验室数据集(如NASA[25]、CALCE[26]和MIT[27])进行验证,对实际场景数据的验证不足。为缩小这一差距,Liu等[28]尝试构建融合多传感器信息的多模态深度学习框架,并发布了道路实测数据集以推动该领域研究。作为这一研究的补充,近期研究通过利用恒流充电片段和机理相关指标[29],进一步推进了基于车辆现场数据的健康状态评估。此外,学者们还探索了以可解释性和鲁棒性为导向的建模方法,其中采用数据增强与跨化学体系迁移策略来提升模型在多样化工况下的适用性[30]。
尽管取得这些进展,跨化学场景、异常运行条件和分布外(OOD)样本的泛化能力仍然面临挑战,这主要源于车队的高度异质性和运行因素的非平稳性。领域自适应和迁移学习能在一定程度上缓解分布偏移[31][32][33];例如,基于特征匹配的迁移方法已被用于跨领域和材料类型的表征映射,以实现域偏移下的高效容量估计[34]。然而,当源域与目标域差异显著时,纯粹基于对齐的自适应仍可能导致负迁移和性能不稳定[35]。此外,现有方法普遍缺乏车云协同场景下的系统验证,对开放车队部署中的预测可靠性保障有限。
近年来,大型语言模型(LLMs)通过大规模语料库的预训练展现出通用认知能力,为突破上述局限提供了新方向[36]。若将LLMs与物理信号有效结合,其在少样本学习、跨领域知识迁移及复杂语义理解方面的潜力,有望引入通用物理常识知识与逻辑推理能力,从而提升SOH估计的鲁棒性。最新研究开始探索LLMs在SOH相关任务中的应用。部分工作利用LLMs的语义理解能力辅助特征工程并实现数据预处理自动化[37]。另有研究尝试直接将电池时序数据输入LLMs进行SOH估计[38]。
尽管具有潜力,将大语言模型应用于健康状态估计仍面临一个源于表征与理解的模态级差异的根本性挑战。大语言模型的预训练与表征学习专为具有组合语义的离散代币设计[39],而电池信号则是受物理定律约束的连续动态轨迹,其时间演化过程编码了退化机制。因此,简单地将数值序列注入以文本为中心的嵌入流形可能导致语义错位与虚假相关性,这使得构建一个可学习且物理一致的、从信号空间到语言空间的映射,对于稳健的健康状态估计至关重要。
与此同时,在保持大语言模型通用能力的同时有效注入电池领域专业知识,需要在参数效率与知识保留之间取得适当平衡。全参数微调的计算成本高昂且可能导致灾难性遗忘,因此近期电池状态估计研究[40]已探索采用混合提示学习等参数高效适应方法。然而,实际健康状态(SOH)估计仍存在根本性缺陷:如图概念性示意图所示,现有混合提示学习框架[41]4(a)类方法通常将条件变量视为自由、随机初始化的嵌入向量,这些向量主要通过下游监督学习获得。当退化线索通过时序语义而非仅靠离散文本来表达时,这种解耦式条件设定无法在学习到的条件变量与退化相关语义之间建立原则性关联——这种关联对于异构车队环境下稳定的长程推理至关重要。因此,将条件变量与对齐语义表征相耦合的"对齐条件知识注入"方法目前仍存在研究空白。
此外,大型语言模型(LLM)产生的幻觉现象不容忽视[42]。当LLMs作为生成式回归器使用时,数值预测以文本形式输出,这额外引入了不确定性层,并可能在开放环境中违反严格的物理约束。因此,量化预测置信度并建立具有拒绝/回退功能的可靠性感知校正机制,对实现安全的车云系统健康状态(SOH)监测至关重要。
针对这些挑战,图1提出了一种领域知识增强的电池健康感知大语言模型框架(HA-LLM)。该框架旨在构建信号与语言表征的Bridge接口,确保真实车队变异性条件下的生成式SOH回归可靠性。该架构构建于车云平台之上,并采用100辆量产车超过一年的实际运行数据进行验证。HA-LLM通过整合异构模态语义对齐技术,将充电动态映射为语言兼容代币,并采用不确定性感知的幻觉抑制机制以实现可靠回归,同时以参数高效的提示调谐作为轻量级领域适应工具。主要贡献可概括如下:
  • 1.
    提出了一种异构模态语义对齐模块,通过局部代币化和跨模态注意力机制将连续电池信号映射至LLM嵌入空间。
  • 2.
    在冻结主干网络条件下,知识约束型信息瓶颈软提示模块从对齐的联合嵌入中生成注意力前缀。
  • 3.
    开发了一种不确定性感知幻觉缓解机制,用于量化预测不确定性,并在低置信度区域与物理一致性估计器进行置信门控融合。
  • 4.
    基于两种电池化学体系现场车辆数据的大规模验证表明,该机制相较于先进基线模型实现了持续性能提升。