跳转至

🖼️ 图像恢复

🧠 NeurIPS2025 · 共 16

Adaptive Discretization for Consistency Models

提出ADCM框架,将一致性模型(CM)的离散化步长选择形式化为约束优化问题,通过Gauss-Newton方法得到解析解,在局部一致性(可训练性)和全局一致性(稳定性)之间自适应平衡,以仅4%的额外计算开销实现显著的训练效率提升和FID改善。

Audio Super-Resolution With Latent Bridge Models

提出 AudioLBM,在波形隐空间中用桥模型实现 LR-to-HR latent-to-latent 音频超分,配合频率感知训练和级联设计,LSD 平均改善 21.5%,首次实现 any-to-192kHz 音频超分。

DenoiseRotator: Enhance Pruning Robustness for LLMs via Importance Concentration

提出 DenoiseRotator,在剪枝前通过可学习正交变换最小化参数重要性分数的信息熵,将重要性集中到少数参数上,使 LLaMA3-70B 在 2:4 半结构化稀疏下困惑度退化缩小 58%(8.1→3.4),可即插即用组合 Magnitude/Wanda/SparseGPT。

DynaGuide: Steering Diffusion Policies with Active Dynamic Guidance

提出 DynaGuide,在推理时通过外部潜在动力学模型对预训练扩散策略施加 classifier guidance,无需修改策略权重即可引导机器人朝向任意正/负目标,在 CALVIN 仿真上平均成功率 70%,真实机器人达 80%。

Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark

针对热红外(TIR)图像中低对比度、模糊、噪声等多种退化耦合的问题,提出基于双提示融合的渐进式网络PPFN和选择性渐进训练策略SPT,并构建首个大规模多场景TIR基准数据集HM-TIR,在复合退化场景下PSNR提升8.76%。

GC4NC: A Benchmark Framework for Graph Condensation on Node Classification with New Insights

提出 GC4NC——首个系统化的图凝缩(Graph Condensation)评估基准框架,跨 8 个维度(性能/效率/隐私保护/去噪/NAS有效性/可迁移性等)统一评估多种图凝缩方法,发现轨迹匹配方法最优、无结构方法效率最高,并在 1000x 压缩下图凝缩显著优于图像凝缩。

Improving Diffusion-based Inverse Algorithms under Few-Step Constraint via Learnable Linear Extrapolation

提出 Learnable Linear Extrapolation (LLE)——用可学习的线性组合系数将当前和历史 clean data estimate 组合,以增强任何符合 Sampler-Corrector-Noiser 范式的扩散逆问题算法在少步(3-5步)下的表现,仅需 50 个样本、几分钟训练,跨 9+ 算法 × 5 个任务一致提升。

Learning Cocoercive Conservative Denoisers via Helmholtz Decomposition for Poisson Inverse Problems

提出共循环保守(CoCo)去噪器概念,通过广义Helmholtz分解设计新的训练策略——Hamiltonian正则化促进保守性 + 谱正则化促进共循环性——使去噪器成为隐式弱凸先验的近端算子,从而在Poisson逆问题(光子受限去卷积、低剂量CT等)中实现有收敛保证且性能优越的PnP方法。

Map Estimation With Denoisers Convergence Rates And Guarantees

证明了一个简单的 MMSE 去噪器迭代平均算法(与 Cold Diffusion 等实践方法密切相关)在对数凹先验假设下可证明收敛到负对数先验的近端算子,收敛速率为 Õ(1/k),为一类经验上成功但缺乏理论保证的去噪方法提供了严格的理论基础,并将其嵌入近端梯度下降框架解决 MAP 估计问题。

Mro Enhancing Reasoning In Diffusion Language Models Via Multi-Reward Optimizati

MRO通过多奖励优化捕获扩散语言模型内/间序列token相关性,加速DLM推理同时保持性能。

Rethinking Circuit Completeness in Language Models: AND, OR, and ADDER Gates

系统引入AND、OR、ADDER三种逻辑门来分解语言模型电路,揭示电路不完整性主要源于OR门的遗漏,提出结合noising和denoising干预的框架来完整恢复三种逻辑门,同时保证忠实度和完整性。

Rethinking Nighttime Image Deraining Via Learnable Color Space Transformation

提出CST-Net用于夜间图像去雨:基于夜间雨在Y通道(亮度)上比RGB更显著的观察,设计可学习颜色空间转换器(CSC)在YCbCr空间去雨,配合隐式光照引导模块(IIG)和新构建的光照感知合成数据集HQ-NightRain,在多个基准上达到SOTA。

Scsplit Bringing Severity Cognizance To Image Decomposition In Fluorescence Micr

提出 scSplit,通过引入混合比例感知的归一化模块(SCIN)和回归网络(Reg),使基于 InDI 的迭代图像分解方法能够感知荧光显微镜图像中两种结构叠加的严重程度,在5个公开数据集上统一解决图像分离和渗透去除两个任务。

Spiking Meets Attention Efficient Remote Sensing Image Super-Resolution With Att

提出 SpikeSR,首个基于注意力脉冲神经网络(SNN)的遥感图像超分辨率框架,通过脉冲注意力块(SAB)结合混合维度注意力(HDA)和可变形相似度注意力(DSA),在 AID/DOTA/DIOR 上达到 SOTA 性能同时保持高计算效率。

The Effect Of Optimal Self-Distillation In Noisy Gaussian Mixture Model

用统计物理replica方法分析噪声高斯混合模型上的自蒸馏,证明硬伪标签的去噪是性能提升主因,CIFAR-10实验验证。

Video Killed the Energy Budget: Characterizing the Latency and Power Regimes of Open T2V Models

对开源T2V模型进行系统性延迟与能耗分析:建立了基于FLOP的compute-bound理论模型,验证了WAN2.1-T2V的二次空间/时间缩放和线性去噪步数缩放规律,并横向对比7个T2V模型发现能耗差异达3000倍(AnimateDiff 0.14Wh vs WAN2.1-14B 415Wh)。