DirPA: Addressing Prior Shift in Imbalanced Few-shot Crop-type Classification¶

会议: CVPR 2026
arXiv: 2603.12905
代码: 待确认
领域: 少样本学习 / 遥感农业分类
关键词: few-shot learning, class imbalance, prior shift, Dirichlet augmentation, crop classification

一句话总结¶

通过 Dirichlet 先验增强（DirPA），在少样本训练阶段主动模拟真实世界长尾类别分布，从而消除人工平衡训练集与自然不平衡测试分布之间的先验偏移，提升作物分类的鲁棒性。

背景与动机¶

农业监测中的作物类型分类面临两个核心困难：（1）标注成本高导致样本稀缺，适合少样本学习；（2）自然界中作物分布极度不平衡（某些作物覆盖大面积，稀有作物仅占极小比例）。少样本学习（FSL）的标准范式通常人为构造平衡的 support set，但这与真实测试场景的长尾分布严重不一致，产生 prior shift 问题。模型在平衡数据上表现良好，一旦面对高度倾斜的真实分布，性能急剧下降。已有 FSL 方法大多假设训练/测试时类别先验相同，忽视了这一关键差距。

核心问题¶

如何在少样本学习中应对训练与测试之间的类别先验偏移（prior shift），使模型在极度不平衡的真实作物分布下仍然保持稳定分类精度？

方法详解¶

整体框架¶

DirPA 在 FSL 训练阶段对 episode 构造进行干预。核心思路：不再固定使用均匀先验，而是从 Dirichlet 分布中采样类别比例向量，用于在每个 episode 中重新构造 query set 的类别分布。这样模型在训练时就能接触到各种可能的不平衡程度，从而学习到对先验偏移更鲁棒的表征。

关键设计¶

Dirichlet 分布采样：Dirichlet 分布是多项分布的共轭先验，参数 α 控制采样出的概率向量的集中程度。较小的 α 产生极度倾斜的分布，较大的 α 产生接近均匀的分布。DirPA 在训练中随机采样 α，使模型适应从均匀到极端倾斜的各种先验。
Episode 重构造：根据采样的先验向量动态调整每个 episode 中各类的查询样本数，模拟真实场景中不同作物比例的情况。
跨国扩展验证：从原始单区域实验扩展到欧盟多个国家（不同气候、农业结构、作物组合），验证方法的地理泛化能力。

损失函数 / 训练策略¶

在标准 FSL 损失（如交叉熵或原型网络中的距离度量损失）基础上，通过 episode 构造引入先验多样性。训练时每个 episode 的类别比例由 Dirichlet 采样决定，等效于对损失函数施加了隐式的分布正则化。

实验关键数据¶

在欧盟多个国家（地理、气候差异大）的卫星遥感作物分类数据上验证
全文包含 28 张表，说明多区域、多场景的全面消融和对比
DirPA 在极端长尾分布（如真实比例高达 100:1 甚至更高）下稳定提升分类性能
相比标准平衡 episode 训练，DirPA 显著改善稀有类别的 per-class accuracy

消融实验要点¶

Dirichlet 参数 α 的选择对鲁棒性有直接影响：过大则接近均匀训练无增益，过小则训练不稳定
不同地理区域的提升幅度不同，但 DirPA 的收益方向一致
在各种 FSL backbone（原型网络等）上均有效

亮点¶

问题定义精准：明确指出 FSL 中 prior shift 是被忽视的主要瓶颈
Dirichlet 增强思路简洁优雅，不需要修改网络结构，即插即用
跨地理区域验证（多国多区域）提升了结论的可靠性
实验极为详尽（28 张表）

局限性 / 可改进方向¶

聚焦于遥感作物分类，对其他领域（医学影像、自然图像）的迁移效果未验证
Dirichlet 参数 α 的自适应选择策略值得进一步探索，目前似乎需要手动调优
方法对 FSL 框架的适用性理论分析有限，更多是经验验证
未与近期其他处理 prior shift 的方法（如 transductive FSL、calibration-based 方法）做深入对比

与相关工作的对比¶

与标准原型网络、MAML 等 FSL 方法相比，DirPA 在不改变模型的前提下通过数据采样策略即可提升鲁棒性
与 transductive FSL（利用 query 统计信息对齐先验）的不同在于 DirPA 是 inductive 的，无需访问测试分布
与 class-balanced sampling、过采样等传统策略不同，DirPA 是主动模拟多种分布而非固定某种平衡策略

启发与关联¶

Dirichlet 先验增强的思路可以推广到任何存在 train/test 分布偏移的 FSL 场景
对于长尾分布的视觉识别任务（如少样本目标检测、语义分割），类似的先验模拟策略值得尝试
与 domain generalization 中的数据增强思路相呼应，只是作用在标签空间的先验维度

评分¶

新颖性: ⭐⭐⭐ 核心 idea（Dirichlet 先验模拟）简洁有效，但理论贡献有限
实验充分度: ⭐⭐⭐⭐ 28 张表，多国多场景验证，非常全面
写作质量: ⭐⭐⭐⭐ 问题定义清晰，实验组织有条理
价值: ⭐⭐⭐ 对遥感 FSL 社区价值明确，但通用性受限于应用领域