ICCV 2025 图像恢复 All-in-One天气去除光谱分解空间分组 Transformer Sobel算子 SVD 注意力机制

Robust Adverse Weather Removal via Spectral-based Spatial Grouping (SSGformer)¶

会议: ICCV 2025
arXiv: 2507.22498
代码: https://github.com/jeongyh98/SSGformer
领域: 图像复原 / 恶劣天气去除
关键词: All-in-One天气去除, 光谱分解, 空间分组, Transformer, Sobel算子, SVD, 注意力机制

一句话总结¶

SSGformer 提出一种基于光谱分解和分组注意力的 All-in-One 恶劣天气图像复原方法：利用 Sobel 算子提取高频边缘信息和 SVD 分析低频退化纹理，将二者融合后生成空间分组掩码（grouping-mask），在组内执行通道和空间注意力以实现对多种天气退化（雨、雪、雾、雨滴）的鲁棒去除。

研究背景与动机¶

领域现状：恶劣天气条件（雨、雪、雾、雨滴）会严重退化图像质量，影响下游视觉任务。早期研究针对单一天气条件建立专用模型，近年来 All-in-One（AiO）方法兴起，旨在用统一模型处理多种天气退化。代表方法有 AIRFormer、Fourmer、AdaIR、WeatherDiff 等。

现有痛点： - 频域方法的全局操作问题：现有频域修复方法（Fourmer 通过傅里叶变换、AIRFormer 通过小波变换）对整个图像的频率做全局滤波。这对重复性退化（如模糊、均匀噪声）有效，但恶劣天气的退化是高度不均匀和局部化的（如雨滴只出现在局部位置），全局滤波难以精准处理。 - 小波变换的分辨率损失：小波变换会将图像分辨率减半，使用频域信息后需要上采样回原尺寸，可能引入失真。 - 缺乏空间上下文的精细分组：不同天气退化在空间上分布不均，需要识别并分组具有相似退化特性的区域来进行针对性修复。

核心矛盾：AiO 模型面临"多样退化模式"与"统一处理框架"之间的矛盾。天气退化的高度随机性和局部性要求模型既能提取有效的频谱先验，又能以空间感知的方式组织和处理特征。

本文切入角度：在保留空间细节的前提下提取频谱信息——用 Sobel 算子（不降分辨率）获取高频边缘特征，用 SVD（不降分辨率）获取低频退化纹理特征，然后基于这些特征生成空间分组掩码，在组内执行注意力。

方法详解¶

整体框架¶

SSGformer 是一个 4 阶段的 Transformer Encoder-Decoder 网络，包含三个核心模块：

Spectral-based Decomposition Prompt (SDP)：光谱分析与特征融合
Mask Generator (MG)：根据光谱特征生成空间分组掩码
Spatial Grouping Transformer Block (SGTB)：基于掩码的分组注意力

数据流：退化图像 \(I_D\) → SDP 提取光谱特征 \(F_S\) → MG 生成分组掩码 \(M_p\) → SGTB 在组内做注意力 → 输出清晰图像 \(I_C\)

关键设计¶

Spectral-based Decomposition Prompt (SDP)：
- Sobel 算子：检测高频信息，通过突出灰度强度变化来提取边缘特征 \(F_{Sobel} \in \mathbb{R}^{H \times W \times 1}\)。保持空间分辨率不变。
- SVD 滤波器：对退化图像做奇异值分解，截断高频（保留前 \(k\) 个奇异值），获取低频退化纹理特征 \(F_{SVD} \in \mathbb{R}^{H \times W \times 1}\)。保持空间分辨率不变。
- Spectral Feature Fusion Module：对 \(F_{Sobel}\) 和 \(F_{SVD}\) 分别做精炼后（Sobel refinement block 用卷积 + 特征重组；SVD refinement block 加入可变形卷积与 \(I_D\) 结合），通过多头线性注意力建模高频/低频特征间的互信息关系，输出融合特征 \(F_S\)。
Mask Generator (MG)：
- 功能：从光谱融合特征 \(F_S\) 生成空间分组掩码 \(M_p\)
- 核心思路：掩码将图像区域按退化特性的空间相似度和纹理特征进行聚类分组。同一组内的区域共享相似的退化模式，便于在组内交互信息进行修复。
- 设计动机：天气退化在空间上分布不均——雨滴覆盖局部、雪粒散布各处、雾霾在远处更浓。基于光谱信息的分组能自适应地识别这些退化区域。
Spatial Grouping Transformer Block (SGTB)：
- 分为两种类型：SGTB-C（分组通道注意力）和 SGTB-S（分组空间注意力）
- 功能：利用分组掩码将特征分组，在组内执行注意力操作
- 核心思路：通道注意力关注同一组内不同通道之间的特征关系，空间注意力关注同一组内不同空间位置之间的关系。双注意力协同平衡了特征级和空间级的依赖关系。
- 设计动机：在相似退化特性的区域内做注意力，比全局注意力更高效也更精准——避免了"干净区域"和"退化区域"之间的不当信息混合。

损失函数/训练策略¶

标准的图像复原损失（L1 loss + 感知损失）
多阶段训练：Encoder 4 阶段逐层下采样，Decoder 对称上采样 + 精炼块
每阶段中 SGTB-C 和 SGTB-S 交替使用，数量随阶段 \(p\) 变化（由 \(L_p\) 控制）

实验关键数据¶

主实验¶

在标准天气去除 benchmark 上评估（涵盖去雨、去雪、去雾、雨滴去除）：

SSGformer 在多个 All-in-One 基准上取得 SOTA 性能
在复杂多天气混合退化场景中表现尤为突出
验证了跨多种退化类型的鲁棒一致性

与现有 AiO 方法对比¶

相比 Fourmer（傅里叶变换全局滤波）：SSGformer 在局部退化场景中优势更明显
相比 AIRFormer（小波先验）：SSGformer 保持了空间分辨率不损失，避免了上采样失真
相比 AdaIR（频域退化识别）：SSGformer 的空间分组机制更有效地处理了非均匀退化
不依赖外部知识（LLM/VLM），纯粹基于图像内部信息

消融实验关键结论¶

Sobel + SVD 组合的有效性：仅用 Sobel 或仅用 SVD 效果均不如两者组合。Sobel 捕捉高频边缘（退化结构），SVD 捕捉低频成分（退化纹理模式），二者互补。
分组掩码的必要性：去掉 MG 模块（直接全局注意力）性能显著下降，证实分组机制是性能提升的关键。
分组注意力 vs. 全局注意力：在效率和效果上均优于全局注意力，因为分组减少了无关区域的信息干扰。
SDP 中多头线性注意力的作用：比简单拼接更好地建模了高频/低频特征的交互关系。

关键发现¶

光谱先验无需傅里叶/小波变换：用传统的 Sobel 边缘检测和 SVD 低秩近似就能有效提取退化相关的频谱信息，且不损失空间分辨率
空间分组是 AiO 天气去除的关键：将空间上相似的退化区域聚类后进行组内注意力，比全局注意力更精准
SGTB 的通道+空间双注意力设计平衡了多尺度依赖关系

亮点与洞察¶

"保留空间分辨率的光谱分析"理念：传统频域方法（FFT、DWT）都会改变空间维度，而 SSGformer 选择 Sobel 算子和 SVD 在不改变空间分辨率的情况下提取频谱信息，这是一个简单但有效的设计选择。
分组注意力的退化感知性：掩码不是固定的网格或规则分块，而是根据退化特性自适应生成的，这意味着模型能够自动识别"哪些区域受到类似退化并应该一起处理"。
不依赖外部知识：在一些最新方法引入 LLM/VLM 外部知识的趋势下，SSGformer 坚持基于图像内部信息（光谱分解 + 空间聚类）来实现鲁棒修复，说明精心设计的内部先验利用足以达到 SOTA。
SVD 的退化纹理分析用途新颖：SVD 通常用于低秩近似或降维，此处将其用于分析退化图像的纹理模式（截断后的低频信息 = 退化全局模式），是一个巧妙的应用扩展。

局限与展望¶

计算效率：虽然分组注意力比全局注意力高效，但 SVD 分解本身的计算开销较大，可能限制在高分辨率图像或实时场景中的应用
分组数量和粒度：MG 生成的分组掩码的粒度选择可能影响性能，过细或过粗的分组都可能带来问题，但论文中对此的自适应调节能力讨论有限
SVD 截断参数 \(k\) 的选择：保留多少奇异值是一个超参数，可能需要针对不同天气类型调优
混合天气退化：虽然宣称处理多种天气，但对"同一图像中同时存在多种天气退化"（如雨+雾混合）的情况未做专门评估
Sobel 算子的固定性：使用固定的 Sobel 核检测边缘，可能不如可学习的边缘检测器灵活

亮点与洞察¶

局限与展望¶

评分¶

新颖性: 待评
实验充分度: 待评
写作质量: 待评
价值: 待评

Robust Adverse Weather Removal via Spectral-based Spatial Grouping (SSGformer)¶

一句话总结¶

研究背景与动机¶

方法详解¶

整体框架¶

关键设计¶

损失函数/训练策略¶

实验关键数据¶

主实验¶

与现有 AiO 方法对比¶

消融实验关键结论¶

关键发现¶

亮点与洞察¶

局限与展望¶

亮点与洞察¶

局限与展望¶

相关工作与启发¶

评分¶

相关论文¶