Are Pretrained Image Matchers Good Enough for SAR-Optical Satellite Registration?¶

会议: CVPR 2026
arXiv: 2604.10217
代码: 无
领域: 遥感图像
关键词: SAR-光学配准, 图像匹配, 跨模态, 零样本迁移, 卫星图像

一句话总结¶

本文在零样本设置下评估了24个预训练图像匹配器族在SAR-光学卫星配准上的表现，发现部署协议选择（几何模型、tile大小等）对精度的影响可达33倍，有时超过更换匹配器本身的效果。

领域现状：灾难响应中云层覆盖常使光学图像不可用，需将SAR图像配准到光学底图以生成地理参考损伤评估。但最佳图像匹配器是为室内/城市自然图像设计的。

现有痛点：光学和SAR传感器通过根本不同的物理观测同一场景——光学记录反射光（纹理丰富），SAR记录雷达回波（散斑噪声、透视叠掩、辐射反转）。预训练匹配器是否能在这种极端域偏移下工作？

核心矛盾：跨模态匹配需要模态不变的特征表示，但预训练数据中几乎没有卫星或SAR图像。

本文目标：在不进行任何微调或域适应的纯零样本设置下，评估24个匹配器族的跨模态卫星配准性能。

切入角度：统一的确定性评估协议，包括大图像分块推理、鲁棒几何滤波和tie-point锚定指标。

核心idea：跨模态迁移是不对称的——显式跨模态训练不总是优于纯自然图像训练，基础模型特征可能部分替代跨模态监督。

24个匹配器族 × 统一评估协议（分块推理+RANSAC几何滤波+tie-point指标）× SpaceNet9和两个额外跨模态基准。系统性地消融部署协议选择（几何模型、tile大小、内点门控）。

统一评估协议:
- 功能：确保24个匹配器在完全可比的条件下评估
- 核心思路：大图像分块推理（处理卫星图像的超高分辨率）、仿射RANSAC或基础矩阵RANSAC进行几何滤波、tie-point锚定的重投影误差指标
- 设计动机：不同匹配器论文使用不同评估设置，直接对比无意义
部署协议敏感性分析:
- 功能：量化超参数选择对配准精度的影响
- 核心思路：系统扫描几何模型（仿射/基础矩阵/单应性）、tile大小、内点门控阈值等协议参数。发现仅使用仿射几何就将平均误差从12.34px降至9.74px。单个匹配器在不同协议下精度差异可达33倍
- 设计动机：在实际部署中，协议选择可能比匹配器选择更重要
跨模态迁移不对称性发现:
- 功能：揭示显式跨模态训练的非必要性
- 核心思路：XoFTR（可见光-热红外训练）和RoMa（无跨模态训练）都达到3.0px最低误差。MatchAnything-ELoFTR（合成跨模态对训练）以3.4px紧随。DINOv2基础模型特征可能提供了部分模态不变性
- 设计动机：挑战了"跨模态任务必须用跨模态训练"的直觉

纯零样本评估，不涉及训练。所有匹配器使用官方预训练权重。