GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset¶

会议: NeurIPS 2025
arXiv: 2507.14697
代码: 有
领域: 分割
关键词: 梯田地块提取, 细粒度边界标注, 语义分割, 无监督域适应, 遥感数据集

一句话总结¶

构建首个全球性细粒度梯田地块与边界数据集GTPBD，包含47,537张高分辨率影像（0.5-0.7m）和超20万个人工标注地块，提供三级标签支持语义分割、边缘检测、地块提取和无监督域适应四项任务，并在20种方法上进行全面基准评测。

研究背景与动机¶

领域现状：农业地块是精准农业、粮食安全评估、土壤侵蚀监测的基本单元。全球约1.2亿英亩梯田支撑着5亿山区人口，每年减少237亿吨土壤侵蚀，生态与经济价值极高。
现有数据集短板：
现有农业地块数据集（FHAPD、AI4Boundaries、PASTIS等）主要聚焦平原规则农田，对复杂梯田地形几乎无覆盖
大多只提供二分类掩码标签，无法区分相邻梯田梗的共享边界与非共享边界两种拓扑关系
分辨率受限（Sentinel-2为10m、Landsat为30m），不足以支持细粒度梯田地块划分
缺乏跨域UDA评测，模型泛化评估空白
核心动机：收集覆盖全球主要梯田区域的高分辨率影像，设计三级标签和三域划分，构建统一的多任务基准评测平台。

方法详解¶

整体框架¶

GTPBD的核心贡献是数据集构建+多维评测框架。整体流程为：影像采集（GF-2/Google Earth）→ QGIS人工矢量化标注 → 三级标签生成（掩码/边界/地块）→ 三域划分（South/North/Global）→ 四任务基准评测（SS/ED/APE/UDA）。

关键设计¶

1. 影像采集与标注 - 来源：GF-2卫星 + Google Earth，空间分辨率0.5–0.7m，2021-2025年无云影像 - 覆盖范围：中国七大地理区域 + 越南、突尼斯、埃塞俄比亚、秘鲁、墨西哥等14国 - 规模：47,537张512×512影像，覆盖885 km²，>200,000个梯田地块 - 标注团队：50+本硕学生通过QGIS完成矢量化标注，配合严格质量审核

2. 三级标签设计

这是数据集最精巧的设计之一，每个像素同时拥有三种标签： - 掩码标签（Mask）：GDAL栅格化（all-touched策略），梯田=1、背景=0，用于语义分割 - 边界标签（Boundary）：3×3矩形核单次形态学腐蚀，生成3像素宽度的边缘标签，用于边缘检测 - 地块标签（Parcel）：掩码与边界XOR运算 \(\text{Parcel} = \text{Mask} \oplus \text{Boundary}\)，用于地块提取

关键标注策略：田梗宽度≥0.5m时采用双边分割标注（两侧独立矢量边界），<0.5m时采用共边标注（大地块内部线特征切割），精确反映两种梯田拓扑结构。

3. 三域划分（UDA支持） - South（中国南方）：地块小、光谱标准差低、长尾分布最显著 - North（中国北方）：地块面积更大 - Global（中国以外地区）：光谱均值相似但风格差异大 - 提供6个迁移任务：S→N, S→G, N→S, N→G, G→S, G→N

4. 数据集对比

数据集	分辨率(m)	影像数	面积(km²)	全球覆盖	SS/APE/ED/UDA
FHAPD	1-2	68,982	<1000	✗	✓/✓/✓/✗
FTW	10	70,462	166,293	✓	✓/✓/✓/✗
AI4Boundaries	1/10	~15K	~53K	✗	✓/✓/✓/✗
GTPBD	0.5-0.7	47,537	885	✓	✓/✓/✓/✓

GTPBD是唯一同时支持四项任务、全球覆盖、亚米级分辨率的梯田数据集。

损失函数 / 训练策略¶

本文是数据集论文，评测方法均采用原始论文的标准训练配置。统一使用SGD优化器（momentum=0.9, weight decay=1e-4），512×512随机裁剪配合随机翻转/旋转增强，在NVIDIA RTX 4090上训练。数据集按60%/20%/20%划分为训练/验证/测试集，切分在裁剪前完成以保证子集空间独立性。

实验关键数据¶

语义分割¶

方法	Prec.↑	Rec.↑	IoU↑	OA↑	F1↑
UNet	74.11	54.93	46.09	75.46	63.09
DeepLabV3	69.64	73.45	57.04	78.28	71.58
NonLocal	75.06	70.27	51.48	79.52	72.58
SegFormer	74.45	69.07	55.84	78.14	71.66
Mask2Former	71.22	74.33	57.16	78.73	72.74

边缘检测与地块提取¶

边缘检测方法	ODS↑	OIS↑	AP↑
MuGE	62.56	61.93	65.12
PiDiNet	53.70	53.12	52.92
REAUNet-Sober	65.06	63.73	70.09

地块提取方法	IoU↑	F1↑	GOC↓	GUC↓	GTC↓
Mask2Former	56.79	72.44	22.04	45.15	35.53
REAUNet	60.56	75.44	27.02	42.25	36.07
HBGNet	62.44	76.88	27.40	42.52	35.79

消融实验¶

UDA方向消融（S→N方向）：

方法	IoU↑	F1↑
Source Only	48.11	64.96
FDA	40.60	57.75
PiPa	56.35	72.09
HRDA	52.26	68.65
DAFormer	51.64	68.11

N→S方向的UDA效果明显优于S→N（PiPa: IoU 66.65 vs 56.35），说明从大地块域迁移到小地块域更容易。

关键发现¶

Precision vs Recall权衡：NonLocal在Precision/OA上最优，Mask2Former在Recall/IoU/F1上最优，体现CNN与Transformer架构的特性差异
边缘检测关键：REAUNet-Sober内嵌Sobel滤波器在梯田复杂边缘上全面领先，说明显式边缘先验对此任务至关重要
地块提取：HBGNet的双分支框架（低级边界+高级语义并行处理）在IoU/F1/GTC上最优
UDA挑战巨大：即使最好的UDA方法（PiPa）也与全监督差距显著，梯田跨域适应是开放难题
域不对称性：N→S迁移效果远好于S→N，反映小地块的fine-grained特征更难学

亮点与洞察¶

填补关键空白：首个全球梯田细粒度地块数据集，涵盖14国、七大中国地理区域
三级标签设计精巧：一套矢量标注同时生成三种标签，最大化标注投入产出比
评测框架全面：像素级（Prec/Rec/IoU/OA/F1）+ 目标级（GOC/GUC/GTC）+ 边缘（ODS/OIS/AP）三维指标
20种方法系统评测：8分割+4边缘+3地块+5 UDA，覆盖各任务主流方法

局限性 / 可改进方向¶

总面积仅885 km²，与FTW（166K km²）等中低分辨率数据集相比空间覆盖有限
仅二分类（梯田/背景），未考虑作物类型等更细粒度语义
山地梯田占比>80%，丘陵和河谷梯田代表性可能不足
缺少更先进的UDA方法（如MIC系列）基准测试
可结合SAM等foundation model进行零样本梯田提取评测

评分¶

新颖性: ⭐⭐⭐⭐ 首个全球梯田细粒度数据集，填补重要空白
实验充分度: ⭐⭐⭐⭐⭐ 20种方法+三维评估框架，极其全面
写作质量: ⭐⭐⭐⭐ 结构清晰，统计分析详尽
价值: ⭐⭐⭐⭐ 为梯田遥感研究提供关键数据基础设施