【源头活水】2025年 即插即用|全网首发,空间条纹注意力SSA,大感受野特征捕获!


【源头活水】2025年 即插即用|全网首发,空间条纹注意力SSA,大感受野特征捕获!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!
一、论文信息
1

所属单位:德国慕尼黑工业大学计算、信息与技术学院
二、论文概要
Highlight
图4.在SOTS-Indoor(Lietal.,2018)数据集上的图像去雾效果对比。
图6.在DPDD(Abuolaim&Brown,2020)数据集上进行单图像离焦去模糊的比较。
图5.在CSD(陈,方等,2021)数据集上进行图像去雪效果对比。
1.研究背景:
研究问题:图像恢复旨在从退化的观测图像中重建出潜在的高质量图像,这对于监控、遥感和医学成像等领域至关重要。然而,由于问题的不适定性,传统的基于假设和手工特征的方法无法在复杂现实场景中生成准确的结果。
研究难点:尽管卷积神经网络(CNNs)通过学习大规模数据集中的泛化先验在图像恢复方面取得了进展,但它们在处理空间变化模糊和大尺度退化时存在局限性。Transformer模型虽然在高级视觉任务中成功应用,但其自注意力机制的二次复杂度使得在图像恢复任务中难以应用。此外,如何有效利用干净图像与退化图像对之间的巨大光谱差异也是图像恢复中的一个挑战。
文献综述:文章提到了一些旨在提高图像恢复效率的方法,例如在小窗口内计算自注意力、将自注意力应用于通道维度以及开发基于条带的自注意力机制。这些方法虽然降低了复杂度,但仍然保留了自注意力的二次复杂度特性。本文提出的双域条带注意力机制旨在解决这些问题,通过在空间和频率域中执行双域双向注意力,以较低的计算成本增强多尺度表示学习。
2.本文贡献:
双域条纹注意力网络(DSANet):提出了一种双域条纹注意力机制(DSAM),该机制通过增强表示学习来实现图像恢复。DSAM由空间条纹注意力单元(SSA)和频率条纹注意力单元(FSA)组成,分别在空间域和频率域进行特征提取和信息聚合。
空间条纹注意力:SSA通过简单的卷积分支学习权重,对每个像素从相邻位置聚合上下文信息。该单元通过水平和垂直方向的条纹注意力操作,隐式地扩大了网络的感受野。(本推文讲解重点)
频率条纹注意力:FSA通过条形池化技术分离特征到不同的频率组件,并通过轻量级的注意力权重进行调制,以细化频谱。该单元利用条形池化工具将特征分离到两个方向的频率组件中,并通过学习的注意力权重进行调制。
三、创新方法
1
图2:空间条纹注意力SpatialStripAttentionUnit(SSA)。
图3.不同的集成范式。(a)水平条形注意力。(b)垂直条形注意力。(c)空间条形注意力单元(SSA)。
SSA包括垂直和水平方向的条带注意力操作,以水平方向的条带注意力操作为例:
1.输入特征处理:对于给定的输入特征X∈RC×H×W,SSA不再生成查询(Q)、键(K)和值(V)张量,而是直接通过一个轻量级的分支生成注意力权重。这个分支包括全局平均池化(GAP)、1×1卷积和Sigmoid函数。注意力权重的生成过程可以表示为:A=(W1×1(GAP(X)))∈RK,其中W1×1表示1×1卷积,Sigmoid函数用于生成注意力权重,K表示水平条带的长度。
2.特征聚合:通过卷积风格的整合方法获得细化的特征。这种方法的复杂度为HWCK,远低于自注意力的(HW)2C。
3.条带注意力操作:水平方向的条带注意力操作通过两个方向的信息整合来实现。对于任意输入特征,水平方向的条带注意力操作通过计算不同位置的注意力权重来整合信息。例如,在图3(a)中,像素B的值是通过加权求和wABA、wBBB和wCBC得到的,其中wij表示从位置i到位置j的注意力权重。
4.序列操作:通过顺序使用水平和垂直条带注意力操作,SSA可以隐式地扩大网络的接收场。例如,通过水平和垂直操作的组合,中心像素可以感知由K×K确定的整个区域的上下文。
四、实验分析
1.训练与测试:DSANet采用编码器-解码器架构,包含三个尺度,每个编码器和解码器子网络中有三个ResGroup。训练时使用了256×256的图像块,批量大小为8。根据任务复杂性,网络规模通过设置不同的N值进行调整。使用PSNR和SSIM作为评估指标,对DSANet在不同数据集上的性能进行了评估。
2.图像去雾:DSANet在SOTS-Indoor和SOTS-Outdoor数据集上分别以0.96dB和0.54dBPSNR的优势超越了SANet,并且在四个真实世界数据集上也取得了最佳性能。
表1:在SOTS-Indoor(Lietal.,2018)和SOTS-Outdoor(Lietal.,2018)上进行的图像去雾效果对比。

3.图像除雪:DSANet在CSD、SRRS和Snow100K三个数据集上均取得了最佳性能,特别是在CSD数据集上,DSANet比FocalNet在PSNR上高出0.91dB。
4.图像失焦去模糊:DSANet在DPDD数据集上对单图像失焦去模糊任务进行了测试,结果表明DSANet在大多数指标上优于其他方法。
5.图像去噪:DSANet在BSD68数据集上对高斯灰度图像去噪任务进行了测试,结果表明DSANet在所有噪声水平上均优于Restormer。
五、结论
1
研究发现:提出的双域条纹注意力网络(DSANet)在图像恢复任务中取得了最先进的性能。DSANet通过空间和频率条纹注意力单元的结合,有效地提升了网络在多尺度上的表示学习能力,从而在图像去雾、图像除雪、图像离焦模糊和图像去噪等任务中均表现出色。
解释与分析:DSANet通过在空间域和频率域同时进行特征提取和信息聚合,能够更好地处理各种尺度的退化问题。此外,DSANet在保持较低计算复杂度的同时,通过简单的卷积操作实现了高效的注意力权重生成和特征整合,这使得DSANet在图像恢复任务中具有较高的实用价值。
意外发现:尽管DSANet在合成数据集上训练,但其在真实世界图像上的应用也显示出了良好的泛化能力,这表明DSANet具有处理真实世界退化图像的潜力。
本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。
收藏,分享、在看,给个三连击呗!


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录