跳转至

Neurodynamics-Driven Coupled Neural P Systems for Multi-Focus Image Fusion

会议: CVPR 2026 arXiv: 2509.17704 代码: MorvanLi/ND-CNPFuse 领域: 其他(图像融合 / 生物启发计算) 关键词: 多焦点图像融合, 耦合神经P系统, 神经动力学, 决策图, 脉冲机制

一句话总结

提出 ND-CNPFuse,通过对耦合神经 P (CNP) 系统进行神经动力学分析,建立网络参数与输入信号的约束关系以避免神经元异常持续放电,从而在多焦点图像融合 (MFIF) 任务上无需训练即可生成高质量、可解释的决策图。

研究背景与动机

多焦点图像融合 (MFIF) 旨在将同一场景不同焦距拍摄的多幅图像融合成一幅全聚焦图像。核心难点在于生成具有精确边界的决策图 (decision map)。现有方法存在两类问题:

  1. 端到端深度学习方法:直接生成融合图像,但难以保持与源图像的空间一致性
  2. 基于决策图的深度学习方法:利用网络预测聚焦/离焦区域,但内部机制不可解释(黑盒),导致决策图中出现伪边缘和毛刺

耦合神经 P (CNP) 系统是受哺乳动物视觉皮层同步脉冲机制启发的生物神经计算模型,天然适合区分聚焦与离焦区域。但直接将 CNP 应用于 MFIF 时,神经元可能出现异常持续放电,导致脉冲计数无法准确反映聚焦差异。本文通过分析 CNP 神经元的动力学机制来解决该问题。

方法详解

整体框架

ND-CNPFuse 包含三个模块:(a) 输入预处理 → (b) ND-CNP 系统生成决策图 → (c) 像素级融合。给定一对多焦点源图像 \(A\)\(B\),最终融合图像为:

\[F(i,j) = A(i,j) \times DM(i,j) + B(i,j) \times (1 - DM(i,j))\]

关键设计

  1. CNP 神经元动力学分析:每个 CNP 神经元包含三个记忆单元——馈送输入单元 \(U\)、链接输入单元 \(V\) 和动态阈值单元 \(T\),分别按如下规则更新:
  2. \(U(t) = \alpha U(t) + I + K(n)\)(外部输入 \(I\) 累积)
  3. \(V(t) = \sum_{n=0}^{t-1} K(n) \beta^{t-n-1}\)(邻域耦合信号累积)
  4. \(T(t) = \lambda \frac{1-\gamma^{t-1}}{1-\gamma}\)(阈值随迭代增长)

核心定理(Theorem 4)推导了持续放电条件的闭式解: $\(I > \frac{\lambda(1-\alpha)(1-\beta)}{(1-\gamma)(1-\beta+\text{sum}(W))} - \text{sum}(W)\)$ 由此得到 Corollary 1:外部输入必须不超过该阈值,所有参数可根据输入图像自动配置,无需手动调参

  1. SML 输入预处理:使用 Sum-Modified Laplacian (SML) 对源图像进行预处理,将简单的像素值转换为更丰富的特征信号,避免直接使用像素值限制神经元放电。消融实验表明 SML 对结果影响很小,但有助于处理噪声输入。

  2. 基于脉冲计数的决策图生成:两个 ND-CNP 系统 \(\Phi_A\)\(\Phi_B\) 分别以预处理后的 \(A\)\(B\) 为输入运行至最大迭代次数,输出脉冲矩阵 \(SM_A\)\(SM_B\)。在耦合半径 \(r\) 内统计放电次数 \(F_A\)\(F_B\),直接比较生成决策图: $\(DM(i,j) = \begin{cases} 1, & F_A(i,j) > F_B(i,j) \\ 0, & \text{otherwise} \end{cases}\)$ 聚焦区域产生更多脉冲(与人类视觉感知一致),整个过程无需后处理、完全可解释

损失函数 / 训练策略

本方法完全无需训练。所有参数(\(u, v, \tau\) 等)通过神经动力学分析自动配置。关键超参数为耦合半径 \(r=16\)、迭代次数 \(t=110\),敏感性分析表明这两个参数在不同数据集上具有良好的通用性。

实验关键数据

主实验

在四个经典 MFIF 数据集上与 9 种 SOTA 方法对比,采用 6 项指标评估:

数据集 指标 ND-CNPFuse 之前最优 排名
Lytro \(Q_{abf}\) 0.7621 0.7613 (PADCDTNP) 1st
Lytro \(FMI_w\) 0.5967 0.5916 (PADCDTNP) 1st
Lytro SSIM 0.8541 0.8525 (CCF) 1st
MFFW \(Q_{abf}\) 0.7399 0.7384 (DMANet) 1st
MFI-WHU \(FMI_w\) 0.6268 0.6248 (SAMF/DMANet) 1st
Real-MFF PSNR 34.2024 34.0174 (DMANet) 1st

运行时间:MATLAB 0.41s / C++ 0.18s(CPU),优于 GPU 上的 DMANet (0.21s)。 能耗:\(1.12 \times 10^{-5}\) J / 图像对(极低)。

消融实验

配置 \(Q_{abf}\) \(FMI_w\) SSIM PSNR 说明
无神经动力学分析 0.747 0.509 0.841 25.702 基线 CNP 系统
有神经动力学分析 0.762 0.597 0.854 26.990 \(FMI_w\) 提升 17.29%
无 SML 0.761 0.593 0.852 26.983 影响极小
有 SML 0.762 0.597 0.854 26.990 轻微提升

关键发现

  • 神经动力学分析是核心贡献,\(FMI_w\) 指标提升 17.29%,意味着显著改善了特征信息保留
  • 决策图可视化表明 ND-CNP 系统能生成边界更清晰、精度更高的决策图,避免了基线 CNP 的区域误判
  • 参数 \(r\)\(t\) 在四个数据集上表现一致,验证了方法的通用性

亮点与洞察

  1. 生物启发 + 理论驱动:不是简单套用神经计算模型,而是深入分析动力学机制并给出闭式约束条件,使模型可靠可用
  2. 零训练、可解释:完全不需要深度学习训练,决策图生成过程基于脉冲计数比较,物理意义清晰
  3. 极低能耗与实时性:CPU-only 即可实现实时融合(C++ 0.18s),能耗仅 \(10^{-5}\) J 量级,适合边缘部署
  4. 理论分析首次性:首次研究 CNP 系统的神经动力学,为该类模型的理论理解开辟了新方向

局限性 / 可改进方向

  1. 数值提升相对有限,部分指标上仅微幅超越 PADCDTNP 和 DMANet
  2. 当前仅处理两幅输入图像的标准 MFIF 场景,虽然附录中扩展到多图,但复杂度分析不足
  3. 迭代次数 110 次相对较多,能否通过自适应终止策略进一步加速值得探索
  4. SML 预处理对低对比度边缘(如 MFFW 数据集)的处理能力有限,导致 SSIM 不是最优

相关工作与启发

  • 与 DMANet/PADCDTNP 的关系:这些方法同样关注决策图质量,但依赖深度学习黑盒;ND-CNPFuse 提供了一条可解释的替代路径
  • 与 CNP 系列前作的关系:前作提出了 CNP 系统但严重依赖手动调参,本文通过动力学分析解决了参数自动化问题
  • 启发:脉冲计数 → 聚焦度估计的思路可推广到其他需要像素级决策的任务(如显著性检测、深度估计);神经动力学约束的分析范式可应用于其他脉冲神经网络模型

评分

  • 新颖性: ⭐⭐⭐⭐ 首次将神经动力学分析引入 CNP 系统并用于图像融合,理论贡献扎实
  • 实验充分度: ⭐⭐⭐⭐ 4 个数据集、9 种对比方法、6 项指标、消融全面
  • 写作质量: ⭐⭐⭐⭐ 定理推导清晰,图示直观,整体结构规范
  • 价值: ⭐⭐⭐ 融合领域偏小众,数值提升有限,但为可解释融合方法提供了新范式