重庆邮电大学计算机科学与技术学院刘伯红团队在《重庆邮电大学学报(自然科学版)》发表论文《联合边缘检测强化空间细节的语义分割方法》,该研究针对图像语义分割中边缘模糊、准确度低的核心问题,提出一种基于边缘感知的语义分割新方法,通过引入边缘检测模块捕获精细空间细节,有效提升了分割性能,为无人驾驶、医疗影像分析等领域的技术应用提供了新支撑。
该模型采用编码器-解码器架构,构建了三大核心模块协同工作。空间金字塔池化模块(ASPP)负责提取多尺度语义信息,通过4种不同扩张率的空洞卷积和自适应平均池化,精准捕捉不同尺寸物体的全局特征;创新设计的双向多级聚合模块(BMLA)作为边缘检测解码器,通过自顶向下与自底向上的双向特征融合,结合边缘辅助监督机制,生成精准边缘特征以强化空间细节;新型注意力特征融合模块(AFFM)则利用交叉注意力机制,将边缘强化后的空间特征与语义特征深度融合,既凸显物体轮廓又保留内部纹理,解决了传统融合方法难以捕获远距离依赖的问题。

研究团队在Cityscapes和ADE20K两大主流数据集上开展全面实验,采用平均交并比(MIOU)作为核心评价指标。结果显示,该方法在Cityscapes数据集上多尺度测试MIOU达82.53%,较经典的Deeplabv3+模型提升0.51%,优于UPerNet、CCNet等主流算法;在ADE20K数据集上多尺度测试MIOU为45.99%,同样优于DeepLabV3+及各类基于注意力机制的模型。可视化结果表明,新方法能清晰分割物体边界,有效避免相似类别误分,即使对未参与训练的语义类别也能基于边缘特征准确识别。
模块消融实验验证了各核心组件的必要性:仅添加BMLA模块可使MIOU提升0.27%,而同时引入BMLA与AFFM模块时,MIOU较基础模型提升0.5%,证明边缘检测与注意力融合的协同效应。此外,研究还确定了边缘辅助监督的最优参数配置,为同类研究提供了参考。
该方法的创新之处在于将边缘检测与语义分割深度耦合,通过多任务学习实现信息互补,既保持了语义分类的准确性,又强化了空间细节的精细度。其模块化设计具有良好扩展性,可灵活结合各类先进语义分割与边缘检测技术进一步提升性能,有望在智能交通、遥感监测等实际场景中发挥重要作用。