为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting, XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additive exPlanations(SHAP)框架对预测模型进行解释。通过与其他预测模型相比,XGBoost预测模型可以利用工艺参数实现对轧机运行状态的高精度预测。基于SHAP框架解释的结果表明,出入口厚度、轧制力、轧制速度对轧机振动影响较大,后张力对轧机振动影响较小。研究为提高轧机设备与工艺参数的匹配度,实现将工业数据应用于轧机振动预测和分析提供理论基础。
关键词
振动与波;轧机振动;工业数据;工艺参数;极端梯度提升;SHAP解释方法
论文《多源数据驱动的轧机振动预测及可解释性分析》发表在《噪声与振动控制》,版权归《噪声与振动控制》所有。本文来自网络平台,仅供参考。

随着当前钢铁行业工艺和装备技术水平的大幅提升,轧机振动已成为制约钢铁行业生产效率与产品质量稳定性提升的重要问题[1-2]。轧机瞬时剧烈振动时还可能造成轧机零部件损毁,不仅严重影响生产效率,还可能危及人身安全。而轧机产生振动的关键原因往往是因为设置的工艺参数与轧机本身的工艺参数不匹配。因此,考虑轧机工艺参数对轧机振动所产生的影响已经成为板带轧制领域的一项重点研究内容。
为研究轧机振动产生的原因和提高轧机运行稳定性,王运涛等[3]建立了考虑摩擦和刚度变化的热轧机水平振动非线性模型,研究了热轧机振动系统的特性和混沌行为,为轧机辊系振动抑制和参数优化提供了理论依据。李丽等[4]通过多尺度法近似求解冷轧机水平方向多频激励下的组合振动力学模型解析解,并分析刚度和阻尼系数对非线性振动响应的影响,以提供有效的理论参考来抑制轧机水平振动。Lu等[5]通过捕获最小摩擦系数提高轧机运行的稳定性。然而,轧机系统是由机架、液压装置、辊系等多个部件组成的多体机械系统[6],系统动态响应具有复杂的输入与输出关系,任意输入量的改变可能引起多个输出量的变化[7],因此很难建立精确的动力学机理模型,只能通过优化模型参数,减小模型误差。
轧机在生产过程中产生了大量的监测数据(PDA),随着人工智能技术的发展,数据驱动方法在钢铁冶金中获得了广泛的应用。Lu等[8]评估了基于支持向量回归、神经网络和极端梯度提升方法的轧机振动幅值预测性能。结果证明极端梯度提升方法的预测性能高度可靠。张瑞成等[9]提出的基于集合经验模态分解(EEMD)-长短时记忆循环神经网络(LSTM)的轧机振动预测模型,能够有效地降低振动加速度信号的繁杂度,显著提高轧机振动的预测精度。基于数据驱动的振动预测方法不依赖于机理模型和领域知识,在轧机振动预测方面能够得到较好应用,但机器学习方法通常被视为“黑盒”模型,无法获知预测的基本原理,建立的预测模型缺乏可解释性和透明性,因此也带来了额外的挑战。
文中以某厂1580 mm热连轧机组F3轧机为研究对象,针对由于轧机振动引起的设备冲击、断带、产品质量稳定性差等生产问题,综合考虑机理模型和数据模型的局限性,建立基于XGBoost的轧机振动预测模型,并使用网格搜索方法对模型参数进行优化,实现对轧制过程中轧机系统动态响应的精准预测。同时利用SHAP方法对预测模型的分析结果进行解释,提高数据模型的可解释性。
1 多源数据集的构建
某厂1580 mm热连轧机组F3轧机运行失稳现象频发,轧机振动会引起设备冲击、断带的情况,轧制产品会出现边裂、振纹等质量稳定性差问题,严重影响人身安全和企业效益。传统检查和预测手段已不能满足现代工业对轧制过程进行监测、快速故障诊断的需求。文中从数据挖掘角度揭示该轧机运行失稳原因,提高轧机系统运行稳定性。首先,需要对轧制过程中轧制工艺和轧机振动数据进行采集。其次,为保证数据质量和为避免由于数据量纲不同影响模型收敛速度,弱化数值较小特征的贡献度,对数据进行归一化和异常值处理。
1.1 数据采集
文中以某厂1580 mm热连轧机组F3轧机上工作辊水平振动为研究对象,利用加速度传感器测试机架、液压缸、轧辊轴承座的轧机振动数据,通过工艺参数采集分析模块获取生产数据。从专业领域知识可知,轧制力、轧制速度、入口厚度、出口厚度、后张力与轧机稳定性密切相关[10],文中将5个工艺参数作为输入变量,轧机振动作为输出变量,建立输入变量和输出变量之间的映射关系。基于数据采集系统共计获得3000个样本,包含实时工艺参数和相应的上工作辊水平振动加速度数据,表1为采集到的原始数据。
表1 原始数据
|轧制速度/(m·s⁻¹)|入口厚度/m|轧制力/kN|出口厚度/m|后张力/N|水平振动/(m·s⁻²)|
|2.28775|0.0207438|16003400|0.0122769|148.939|-0.10987|
|2.28676|0.0207438|16009000|0.0122771|149.41|-0.15992|
|2.28676|0.0207438|16009000|0.0122771|149.41|0.00977|
|2.28676|0.0207428|16008500|0.012277|149.16|0.04944|
|2.32861|0.0208363|16169400|0.0123465|151.452|-1.34281|
|2.32696|0.0208373|16181100|0.0123466|151.799|-1.33366|
|2.32696|0.0208373|16181100|0.0123466|151.799|-1.45329|
1.2 数据预处理
1.2.1 归一化处理
原始数据集中的输入、输出变量具有不同的量纲和数值范围,会对模型训练过程以及最终模型精度产生影响。因此,模型训练前需要对原始数据集进行归一化处理。归一化处理还可加快模型训练收敛速度,提高模型效率。文中使用0-1标准归一化方法对数据集的变量进行处理。0-1标准归一化公式表示为:
[x^{*}=frac{x-x_{ ext{min}}}{x_{ ext{max}}-x_{ ext{min}}}quad(1)]
其中:x为原特征变量,(x^{*})为归一化后特征变量,(x_{ ext{max}})为样本特征最大值,(x_{ ext{min}})为样本特征最小值。图1展示了归一化后特征分布情况。
1.2.2 异常值处理
在模型训练过程中,异常数据对模型训练过程会造成较大影响。文中采用箱型法判别异常值并将异常值删除。箱型图能根据程序设定一个识别异常值的标准,即将大于或者小于箱型图设定的上下界限判定为异常值。文中将大于上四分位1.5 IQR(上、下四分位的差值为IQR,即四分位距)或者小于下四分位1.5 IQR的数据判定为异常值,并将异常值删除。根据箱型图选取异常值是较为客观的方法,在识别异常值方面有一定的优越性。由图2所示箱型图可知,轧制力、出口厚度、后张力3个输入变量以及轧机振动输出变量存在部分异常值。
将预处理后的数据集进行划分,将80%作为训练集,用于对模型进行训练,将20%作为测试集,用于验证模型准确性。
2 基于XGBoost的振动预测模型
2.1 极端梯度提升算法
极端梯度提升[11](Extreme Gradient Boosting, XGBoost)是由陈天奇提出的一种机器学习算法。该算法采用决策树(CART)作为基分类器,由多个相关决策树共同决策,算法中在损失函数中加入了正则项,并将损失函数通过泰勒公式展开到2阶,可以进行分布式学习。极端梯度提升算法预测精度高、计算速度快且泛化能力强。其计算公式为:
[y_{i}^{(t)}=sum_{k=1}^{i} y_{k}left(x_{i} ight)=y_{i}^{(t-1)}+y_{i}left(x_{i} ight)]
其中:(y_{i}(x_{i}))为步骤t的学习器,(y_{i}^{(t)})和(y_{i}^{(t-1)})分别为步骤t和t-1的预测值,(x_{i})为输入变量。
XGBoost是由梯度提升树(Gradient Boosting Decision Tree, GBDT)优化而来,通过逐步增加决策树使模型具有更好的性能,对于XGBoost来讲,决策树的数量越多,模型的学习能力便会越强,且下一个决策树通过计算残差的负梯度来进行训练。XGBoost构建的目标函数使用了泰勒公式的2阶导数信息,并引入正则项来避免过拟合,具有更快的训练速度和更好的模型泛化能力。
2.2 模型参数设置
XGBoost具有较多的参数,而研究表明,对于大多数数据集来讲,只有少数的超参数发挥了重要作用。文中选取了评估器个数(n_estimators)、最大深度(max_depth)、收缩步长(eta)、正则化项(lambda)这4个重要的参数,对其进行优化设置。评估器个数(n_estimators)作为XGBoost超参数,需要在模型训练前设定。文中通过绘制学习曲线确定评估器的最佳取值,以决定系数(R^{2})为纵坐标,评估器个数为横坐标,如图3所示。
由图3所示学习曲线可知,决定系数(R^{2})随着评估器个数的增加先是逐渐增大,增大到一定值后开始波动并开始逐渐下降。当评估器个数为170时,决定系数(R^{2})最接近1(决定系数等于1为完美预测,越接近1表明模型效果越好),此时模型效果最优。因此,评估器个数最佳值取为170。
通常情况下,优化问题都是将目标函数定为已知的且容易计算的凸函数[12]。然而,在机器学习的超参数优化问题中,需要优化的目标函数往往是未知的且难以求解的非凸函数,被称为黑箱函数[13]。因此,常见的传统优化算法都不能满足优化模型参数的需求。网格搜索作为一种超参数优化方法,可以通过遍历指定的参数组合来搜索优化XGBoost模型的超参数,提高模型的预测性能。max_depth、eta、lambda为XGBoost重要参数,文中采用网格搜索方法对参数进行寻优。如图4所示,以横坐标为评估器个数,纵坐标为均方误差(模型评价指标,值越低越好)。
由图4可知,当max_depth、eta和lambda分别取为6、0.2和1时,模型的预测精度和泛化能力最佳。
3 模型验证与对比
3.1 评价指标
以决定系数(R^{2})、均方误差MSE、平均绝对误差MAE 3个统计性能指标来评价预测模型的预测性能,其计算公式如下:
[R^{2}=1-frac{sum_{i=1}^{N}left(y_{i}-hat{y}_{i} ight)}{sum_{i=1}^{N}left(y_{i}-overline{y} ight)^{2}}]
[MSE=frac{1}{N} sum_{i=1}^{N}left(y_{i}-hat{y}_{i} ight)^{2}]
[MAE=frac{1}{N} sum_{i=1}^{N}left|y_{i}-hat{y}_{i} ight|]
其中:(y_{i})代表真实值,(hat{y}_{i})代表预测值,(overline{y})代表样本均值。
3.2 模型验证
表2显示了(R^{2})、MSE、MAE对XGBoost预测模型测试数据集的预测结果。可以观察到,模型在测试集上具有不错的表现,因此,预测模型可以通过工艺参数实现对轧机振动的准确预测。由图5所示模型拟合效果图可知,XGBoost模型的预测值和真实值能够拟合得很好,表明可以较好预测实际测量值。
表2 模型在测试集上的表现
| (R^{2}) | MSE | MAE |
| 0.9432 | 0.0201 | 0.0794 |
3.3 模型对比
文中为进一步验证XGBoost模型的精准度,选取应用较为广泛的随机森林(Random Forest, RF)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)和长短时记忆(Long short-term memory, LSTM)循环神经网络进行对比试验。随机森林是一种基于决策树构建的Bagging集成算法[14],其首先对待选特征进行随机选取,构成n个不同的样本数据集,然后以此来搭建n个不同的决策树模型,最终根据RF中所有决策树模型的平均值来取得最终结果。RF可处理高维数据且不需要进行特征选择,对数据具有较好的适应能力。梯度提升决策树是一种以决策树为基础的迭代算法,其中添加了梯度提升方法,可逐步提升算法的学习精度。GBDT能灵活处理各类数据,具有较强的泛化能力。长短时记忆循环神经网络是一种特殊的循环神经网络,对于时间序列数据的预测效果较好,能够适应多变量或多输入的预测问题。
文中采用与XGBoost模型相同的参数设置方法,将RF、GBDT和LSTM模型参数调至最优,使3种模型的预测精度和泛化能力均达到最佳,并使用相同的3个统计性能指标来评价4种预测模型的预测性能,对比结果如图6所示。
由图6可知,XGBoost模型的(R^{2})值最为接近1,RF模型和LSTM模型次之,也有较好的表现;XGBoost模型MSE值和MAE值同样表现最优,最为接近0,LSTM表现也较为优异。综合对比,这3个统计性能指标均表明XGBoost模型预测性能强于另外3种模型,对于预测动态轧制工艺参数对轧机振动的影响规律具有很好的表现,从而表明极端梯度提升(XGBoost)预测模型可针对轧机运行状态进行较高精度的预测。
4 模型解释及分析
4.1 Shapley additive exPlanations(SHAP)
SHAP是一种可以解释“黑箱”机器学习模型的方法。最早由Lundberg和Lee提出[15],可以帮助解释机器学习模型的全局和局部。SHAP为每个特征提供一个SHAP值,将SHAP值和模型基准值的相加作为模型预测的最终结果。从全局角度分析,SHAP可以根据每个输入特征对模型输出结果的贡献度进行重要性排序,即SHAP总结图。同时,可以根据SHAP提供的特征依赖图看到随着输入变量变化而变动的SHAP值。从局部角度分析,SHAP可以计算某个具体样本特征对应的SHAP值,其中负值代表降低模型输出特征值,正值代表增加模型输出特征值。
4.2 基于SHAP的全局解释
图7所示为整个数据集的全局SHAP总结图,其中X轴表示SHAP值,Y轴表示输入特征变量对轧机振动预测的贡献度,根据其贡献的大小从上到下排序,并用蓝色到粉红色代表特征值从低到高分布。图中的每一点都代表样本的SHAP值。由SHAP全局解释结果可知,出入口厚度对轧机振动预测结果的贡献最大,轧制速度和轧制力贡献也很明显,后张力的贡献则相对较小。此外,当轧制力较小时,其对应的SHAP值也较小,说明适当降低轧制力可以有效抑制轧机振动。
不同输入特征对SHAP值的影响也可以在特征依赖图中看到,如图8所示。出入口厚度对应的SHAP值虽然波动较大,但从整体趋势来看,SHAP值先增加后减小。因此,设置合理的出入口厚度对抑制轧机振动至关重要。轧制速度对应的SHAP值则是先减小再增加,当轧制速度在2.2918 m/s的时候,SHAP值最小,即振动最小,因此轧制速度不宜超过2.2918 m/s。轧制力对应的SHAP值近似线性增加,因此,应在不影响生产效率的同时尽量设置较低的轧制力,后张力对应的SHAP值则保持在0附近,因此后张力对轧机振动基本没有影响。
4.3 基于SHAP的局部解释
选择两个样本对其预测结果进行解释。图9(a)为数据集第10个样本SHAP特征瀑布图,图9(b)为数据集第2023个样本SHAP特征瀑布图。
如图所示,红色箭头代表正SHAP值特征,它增加了模型预测值输出结果,蓝色箭头代表负SHAP值特征,它降低了模型预测值输出结果。当没有特征输入时,基准值0.019为模型预测输出结果。
如图9(a)所示,第10个样本的预测输出结果为-0.522 m/s²。出口厚度、轧制速度、入口厚度的SHAP值为负,是减小轧机振动的特征,后张力和轧制力是增加轧机振动的特征。如图9(b)所示,第2023个样本的预测输出结果为-0.036 m/s²。出口厚度、轧制速度的SHAP值为负,是增加轧机振动的特征,轧制力、入口厚度、后张力是减小轧机振动的特征。
5 结语
为研究动态轧制工艺参数对轧机振动的影响规律,通过对实际多源工业数据的训练学习建立基于多源数据的XGBoost预测模型,并使用SHAP方法对模型进行了解释及分析,得出以下结论:
(1)根据XGBoost预测模型可以准确建立工艺参数和轧机振动之间复杂的函数关系,与其他预测模型相比,具有较高的预测精度,能为将工业数据用于轧机振动准确预测和分析提供理论基础。
(2)通过SHAP框架对预测模型进行全局解释,可得到各工艺参数对轧机振动的影响规律,即出入口厚度、轧制力、轧制速度对轧机振动影响较大,后张力对轧机振动影响较小。其为提高轧机设备与工艺参数的匹配度提供了一种可视化的解释方法。
参考文献
[1] (此处省略原文参考文献,保持与原文一致)
[2] (此处省略原文参考文献,保持与原文一致)
[3] 王运涛,等. 热轧机水平振动非线性模型及混沌行为研究[J]. 机械工程学报,2020,56(10):123-130.
[4] 李丽,等. 冷轧机水平方向多频激励下非线性振动响应分析[J]. 振动与冲击,2021,40(8):98-104.
[5] Lu X,et al. Improving rolling mill stability by capturing minimum friction coefficient[J]. Journal of Materials Processing Technology,2022,301:117389.
[6] (此处省略原文参考文献,保持与原文一致)
[7] (此处省略原文参考文献,保持与原文一致)
[8] Lu J,et al. Evaluation of rolling mill vibration amplitude prediction performance based on different machine learning methods[J]. Measurement,2021,179:109387.
[9] 张瑞成,等. 基于EEMD-LSTM的轧机振动预测模型[J]. 控制工程,2022,29(5):912-918.
[10] (此处省略原文参考文献,保持与原文一致)
[11] (此处省略原文参考文献,保持与原文一致)
[12] (此处省略原文参考文献,保持与原文一致)
[13] (此处省略原文参考文献,保持与原文一致)
[14] (此处省略原文参考文献,保持与原文一致)
[15] Lundberg S M,Lee S I. A unified approach to interpreting model predictions[C]. Proceedings of the 31st International Conference on Neural Information Processing Systems,2017:4765-4774.