发表学术论文网

王嘉俊、李勇团队在《计算机系统应用》发表面向交通预测的窗口时空注意力建模方法研究论文

  福州大学计算机与大数据学院、福建警察学院王嘉俊、李勇团队在《计算机系统应用》发表研究论文《面向交通预测的窗口时空注意力建模方法》。该研究针对智能交通系统中的关键预测任务,创新性地提出了一种名为窗口时空注意力网络的新型深度学习模型。该模型旨在解决现有交通预测方法在捕捉复杂时空耦合相关性时面临的难题,特别是克服了传统“时空联合建模”方法中普遍存在的计算复杂度高、建模效率低等瓶颈。通过在五个真实交通数据集上的验证,W-STANet模型在预测精度和计算效率上均展现出显著优势,为构建更智能、高效的交通预测系统提供了新思路。

面向交通预测的窗口时空注意力建模方法

  交通预测是智能交通系统的核心,旨在通过分析历史交通数据(如车流量、速度)来精准预测未来路况,其核心挑战在于如何有效建模数据中交织在一起的时间动态性与空间关联性。传统的“时空分离建模”方法(如先使用图神经网络处理空间关系,再用循环神经网络处理时间序列)往往割裂了二者,无法捕捉“时空耦合相关性”(例如,早高峰时段某路段拥堵会快速引发周边路段车流变化)。而“时空联合建模”方法虽然理论上能统一处理时空信息,但在构建“时空超图”时常面临计算量爆炸、建模效率低下等问题,限制了其实际应用。

  为此,研究团队提出了名为W-STANet的创新模型架构。该模型核心由数据嵌入层、时空相关性建模层、预测头三部分组成。其最大创新点在于时空相关性建模层。该层摒弃了对整个庞大时空超图进行全局注意力计算的传统做法,转而采用“窗口化”的局部计算策略。具体而言,模型将时空图在时间和空间维度上划分为多个不重叠的局部窗口,首先在每个窗口内利用多头自注意力机制高效地捕获局部时空依赖关系。

  为了克服局部窗口视野受限的问题,模型巧妙地引入了“数据移位”和“数据交换”操作。在一次完整的建模过程中,模型会依次对原始数据、经过移位操作的数据以及经过交换操作的数据进行窗口注意力计算。这种设计使得信息能够在不同窗口间间接或直接地流动,从而在不显著增加计算量的前提下,让模型同时具备了局部精细感知与全局宏观理解的能力,有效建模了从短距离到长距离的复杂时空相关性。

  该研究在流量预测(PEMS04, PEMS07, PEMS08)和速度预测(PEMS-BAY, METR-LA)共五个公开基准数据集上进行了全面验证。实验结果显示,W-STANet模型在绝大多数指标上超越了包括DCRNN、STGCN、Graph WaveNet、ASTGNN、PDFormer在内的十余种前沿模型。特别是在大规模路网数据集PEMS-BAY的交通速度预测任务中,W-STANet相较于优秀的基准模型PDFormer,在15分钟、30分钟和60分钟预测跨度上,平均绝对误差分别降低了14.4%、17.1%和16.2%,提升效果显著。这证明了其在处理复杂、大规模交通网络时具有更强的时空表征学习能力。

  除了预测精度,模型在计算效率上的优势同样突出。通过在PEMS04数据集上的对比测试发现,引入窗口化计算后,W-STANet的训练速度相比不使用窗口的版本提升了约72%。与预测性能相近的模型ASTGNN和PDFormer相比,其每个训练周期的耗时分别减少了约2.3倍和1.1倍,实现了性能与效率的更好平衡。消融实验进一步证实,模型中的“移位”与“交换”操作对提升预测性能均有积极贡献,二者结合能最有效地协同局部与全局信息。

  综上所述,该研究提出的W-STANet模型,通过创新的窗口化时空注意力机制与数据操作,成功地在保持高计算效率的同时,实现了对交通数据中复杂时空动态相关性的深度联合建模。这项成果不仅为交通预测领域提供了一种新的高性能解决方案,其“局部计算+信息交互”的核心思想也为其他涉及时空图数据建模的领域(如气象预测、社交网络分析)提供了有益的借鉴。未来,研究团队计划进一步探索模型在更长期预测任务中的潜力,并研究如何降低全连接时空超图可能引入的数据噪声,以推动该技术走向更广泛的实际应用。

查阅更多的成功案例文章
热门推荐

接收太阳能追光方面的文章的期刊

英文期刊投稿系统中的Checklist for New Submissions是什么

核电子学与探测技术属于北大核心吗

《数学学报》投稿论文全:建议掌握发文案例、征稿要求与含金量分析等重要信息

微生物应用相关论文投稿

河北省高级经济师课题申报要点介绍

论文怎么写基本结构

上海高级职称评审论文必须一作吗

软著能代替论文吗

期刊约稿是什么意思

论文拒稿后申诉能成功吗

核心期刊书评能跟核心论文一样作为职称材料吗

职称与论文专题
论文发表指导