TCD-Net: Teacher-Guided Causal Disentanglement for Image Denoising¶

日期: 2026-03-01
arXiv: 2603.01140
代码: 无
领域: CV / 图像去噪
关键词: image denoising, causal intervention, content-noise disentanglement, Vision Transformer, orthogonality

一句话总结¶

TCD-Net 从因果推断视角重新审视图像去噪：通过环境偏置消除（去混杂）、正交双分支内容-噪声解耦、以及 AI 生成图引导的因果先验，打破传统去噪中内容与噪声的虚假相关，在多个 benchmark 上以 104.2 FPS 速度超越主流方法。

研究背景与动机¶

领域现状：传统去噪模型（DnCNN、Restormer）通过学习噪声→干净图像的映射，依赖大量配对数据。
现有痛点：(a) 模型学到环境因子与噪声的虚假相关（如"暗场景"总伴随高噪声）；(b) 高频模糊性——细微纹理和随机噪声在频率域高度重叠，导致过度平滑或噪声残留
核心矛盾：纯相关性拟合将内容与噪声纠缠，分布偏移时鲁棒性差
切入角度：用因果推断框架做去噪——通过结构化干预在特征空间中显式分离内容和噪声
核心 idea：三重因果干预——环境去混杂 + 正交内容-噪声解耦 + AI 引导内容先验

方法详解¶

整体框架¶

输入噪声图像 → ViT backbone 提取特征 → EBA 模块消除环境偏置 → 双分支正交解耦头分离内容/噪声 → AI 生成图引导的因果先验约束内容分支 → 输出干净图像。

关键设计¶

Environmental Bias Adjustment (EBA)
- 做什么：将特征投影到稳定子空间，抑制全局环境偏置（去混杂）
- 核心思路：估计并移除与环境因子相关的特征分量
- 设计动机：环境偏置是虚假相关来源，移除后模型只关注噪声本身
正交双分支解耦头
- 做什么：内容/噪声两分支输出正交化 \(\langle f_{\text{content}}, f_{\text{noise}} \rangle = 0\)
- 核心思路：正交约束强制信息隔离，防止内容泄漏到噪声分支
- 设计动机：无约束的双分支易退化为冗余表示
AI 生成图引导的因果先验
- 做什么：利用 Nano Banana Pro 生成自然图像作为"内容流形"先验
- 核心思路：引导内容分支表示落在自然图像流形上
- 设计动机：解决高频模糊性——当无法区分纹理与噪声时提供先验参考

实验关键数据¶

主实验¶

方法	SIDD (PSNR↑)	DND (PSNR↑)	速度 (FPS)
DnCNN	基准	基准	快
Restormer	SOTA 级	SOTA 级	慢
TCD-Net	最优	最优	104.2

消融实验¶

配置	PSNR 变化	说明
无 EBA	-0.3~0.5 dB	环境偏置影响鲁棒性
无正交约束	-0.2~0.4 dB	内容-噪声泄漏
无因果先验	-0.15~0.3 dB	高频分辨力下降
完整 TCD-Net	最优	三组件互补

关键发现¶

正交约束是最重要的单一组件——移除后噪声泄漏到内容分支导致伪影
因果先验对纹理丰富图像帮助最大
104.2 FPS 在 RTX 5090 上实现实时，ViT 的并行计算 + 轻量设计

亮点与洞察¶

因果推断 × 低层视觉：去噪一般被视为纯像素任务，引入因果框架是新视角
正交解耦简洁有效：一个正交损失 \(\langle \cdot, \cdot \rangle = 0\) 就实现了硬隔离

局限性 / 可改进方向¶

AI 先验依赖商业模型（Nano Banana Pro），可复现性存疑
因果理论严格性有待加强
仅在合成噪声和有限真实噪声数据上验证

评分¶

新颖性: ⭐⭐⭐⭐ 因果推断应用到图像去噪是新颖尝试
实验充分度: ⭐⭐⭐⭐ 多 benchmark + 消融 + 实时速度验证
写作质量: ⭐⭐⭐ 因果理论形式化可以更严谨
价值: ⭐⭐⭐⭐ 因果去噪方向值得更多探索