Neurodynamics-Driven Coupled Neural P Systems for Multi-Focus Image Fusion¶
会议: CVPR 2026 arXiv: 2509.17704 代码: MorvanLi/ND-CNPFuse 领域: 其他(图像融合 / 生物启发计算) 关键词: 多焦点图像融合, 耦合神经P系统, 神经动力学, 决策图, 脉冲机制
一句话总结¶
提出 ND-CNPFuse,通过对耦合神经 P (CNP) 系统进行神经动力学分析,建立网络参数与输入信号的约束关系以避免神经元异常持续放电,从而在多焦点图像融合 (MFIF) 任务上无需训练即可生成高质量、可解释的决策图。
研究背景与动机¶
多焦点图像融合 (MFIF) 旨在将同一场景不同焦距拍摄的多幅图像融合成一幅全聚焦图像。核心难点在于生成具有精确边界的决策图 (decision map)。现有方法存在两类问题:
- 端到端深度学习方法:直接生成融合图像,但难以保持与源图像的空间一致性
- 基于决策图的深度学习方法:利用网络预测聚焦/离焦区域,但内部机制不可解释(黑盒),导致决策图中出现伪边缘和毛刺
耦合神经 P (CNP) 系统是受哺乳动物视觉皮层同步脉冲机制启发的生物神经计算模型,天然适合区分聚焦与离焦区域。但直接将 CNP 应用于 MFIF 时,神经元可能出现异常持续放电,导致脉冲计数无法准确反映聚焦差异。本文通过分析 CNP 神经元的动力学机制来解决该问题。
方法详解¶
整体框架¶
ND-CNPFuse 包含三个模块:(a) 输入预处理 → (b) ND-CNP 系统生成决策图 → (c) 像素级融合。给定一对多焦点源图像 \(A\) 和 \(B\),最终融合图像为:
关键设计¶
- CNP 神经元动力学分析:每个 CNP 神经元包含三个记忆单元——馈送输入单元 \(U\)、链接输入单元 \(V\) 和动态阈值单元 \(T\),分别按如下规则更新:
- \(U(t) = \alpha U(t) + I + K(n)\)(外部输入 \(I\) 累积)
- \(V(t) = \sum_{n=0}^{t-1} K(n) \beta^{t-n-1}\)(邻域耦合信号累积)
- \(T(t) = \lambda \frac{1-\gamma^{t-1}}{1-\gamma}\)(阈值随迭代增长)
核心定理(Theorem 4)推导了持续放电条件的闭式解: $\(I > \frac{\lambda(1-\alpha)(1-\beta)}{(1-\gamma)(1-\beta+\text{sum}(W))} - \text{sum}(W)\)$ 由此得到 Corollary 1:外部输入必须不超过该阈值,所有参数可根据输入图像自动配置,无需手动调参。
-
SML 输入预处理:使用 Sum-Modified Laplacian (SML) 对源图像进行预处理,将简单的像素值转换为更丰富的特征信号,避免直接使用像素值限制神经元放电。消融实验表明 SML 对结果影响很小,但有助于处理噪声输入。
-
基于脉冲计数的决策图生成:两个 ND-CNP 系统 \(\Phi_A\)、\(\Phi_B\) 分别以预处理后的 \(A\)、\(B\) 为输入运行至最大迭代次数,输出脉冲矩阵 \(SM_A\)、\(SM_B\)。在耦合半径 \(r\) 内统计放电次数 \(F_A\)、\(F_B\),直接比较生成决策图: $\(DM(i,j) = \begin{cases} 1, & F_A(i,j) > F_B(i,j) \\ 0, & \text{otherwise} \end{cases}\)$ 聚焦区域产生更多脉冲(与人类视觉感知一致),整个过程无需后处理、完全可解释。
损失函数 / 训练策略¶
本方法完全无需训练。所有参数(\(u, v, \tau\) 等)通过神经动力学分析自动配置。关键超参数为耦合半径 \(r=16\)、迭代次数 \(t=110\),敏感性分析表明这两个参数在不同数据集上具有良好的通用性。
实验关键数据¶
主实验¶
在四个经典 MFIF 数据集上与 9 种 SOTA 方法对比,采用 6 项指标评估:
| 数据集 | 指标 | ND-CNPFuse | 之前最优 | 排名 |
|---|---|---|---|---|
| Lytro | \(Q_{abf}\) | 0.7621 | 0.7613 (PADCDTNP) | 1st |
| Lytro | \(FMI_w\) | 0.5967 | 0.5916 (PADCDTNP) | 1st |
| Lytro | SSIM | 0.8541 | 0.8525 (CCF) | 1st |
| MFFW | \(Q_{abf}\) | 0.7399 | 0.7384 (DMANet) | 1st |
| MFI-WHU | \(FMI_w\) | 0.6268 | 0.6248 (SAMF/DMANet) | 1st |
| Real-MFF | PSNR | 34.2024 | 34.0174 (DMANet) | 1st |
运行时间:MATLAB 0.41s / C++ 0.18s(CPU),优于 GPU 上的 DMANet (0.21s)。 能耗:\(1.12 \times 10^{-5}\) J / 图像对(极低)。
消融实验¶
| 配置 | \(Q_{abf}\) | \(FMI_w\) | SSIM | PSNR | 说明 |
|---|---|---|---|---|---|
| 无神经动力学分析 | 0.747 | 0.509 | 0.841 | 25.702 | 基线 CNP 系统 |
| 有神经动力学分析 | 0.762 | 0.597 | 0.854 | 26.990 | \(FMI_w\) 提升 17.29% |
| 无 SML | 0.761 | 0.593 | 0.852 | 26.983 | 影响极小 |
| 有 SML | 0.762 | 0.597 | 0.854 | 26.990 | 轻微提升 |
关键发现¶
- 神经动力学分析是核心贡献,\(FMI_w\) 指标提升 17.29%,意味着显著改善了特征信息保留
- 决策图可视化表明 ND-CNP 系统能生成边界更清晰、精度更高的决策图,避免了基线 CNP 的区域误判
- 参数 \(r\) 和 \(t\) 在四个数据集上表现一致,验证了方法的通用性
亮点与洞察¶
- 生物启发 + 理论驱动:不是简单套用神经计算模型,而是深入分析动力学机制并给出闭式约束条件,使模型可靠可用
- 零训练、可解释:完全不需要深度学习训练,决策图生成过程基于脉冲计数比较,物理意义清晰
- 极低能耗与实时性:CPU-only 即可实现实时融合(C++ 0.18s),能耗仅 \(10^{-5}\) J 量级,适合边缘部署
- 理论分析首次性:首次研究 CNP 系统的神经动力学,为该类模型的理论理解开辟了新方向
局限性 / 可改进方向¶
- 数值提升相对有限,部分指标上仅微幅超越 PADCDTNP 和 DMANet
- 当前仅处理两幅输入图像的标准 MFIF 场景,虽然附录中扩展到多图,但复杂度分析不足
- 迭代次数 110 次相对较多,能否通过自适应终止策略进一步加速值得探索
- SML 预处理对低对比度边缘(如 MFFW 数据集)的处理能力有限,导致 SSIM 不是最优
相关工作与启发¶
- 与 DMANet/PADCDTNP 的关系:这些方法同样关注决策图质量,但依赖深度学习黑盒;ND-CNPFuse 提供了一条可解释的替代路径
- 与 CNP 系列前作的关系:前作提出了 CNP 系统但严重依赖手动调参,本文通过动力学分析解决了参数自动化问题
- 启发:脉冲计数 → 聚焦度估计的思路可推广到其他需要像素级决策的任务(如显著性检测、深度估计);神经动力学约束的分析范式可应用于其他脉冲神经网络模型
评分¶
- 新颖性: ⭐⭐⭐⭐ 首次将神经动力学分析引入 CNP 系统并用于图像融合,理论贡献扎实
- 实验充分度: ⭐⭐⭐⭐ 4 个数据集、9 种对比方法、6 项指标、消融全面
- 写作质量: ⭐⭐⭐⭐ 定理推导清晰,图示直观,整体结构规范
- 价值: ⭐⭐⭐ 融合领域偏小众,数值提升有限,但为可解释融合方法提供了新范式