Novel Architecture of RPA In Oral Cancer Lesion Detection¶

会议: CVPR2025
arXiv: 2603.10928
代码: 待确认
领域: medical_imaging
关键词: 口腔癌检测, RPA, EfficientNetV2B1, 设计模式, 批处理

一句话总结¶

本文将 Singleton 和 Batch Processing 设计模式集成到基于 Python 的 RPA 自动化管道中，结合 EfficientNetV2B1 模型实现口腔癌病灶检测，相比 UiPath/Automation Anywhere 等传统 RPA 平台实现 60-100× 的推理加速。

研究背景与动机¶

口腔癌的早期精确检测对提高患者生存率至关重要，但临床工作流仍受主观人为判断、延迟和决策不一致的困扰
RPA（机器人流程自动化）已在医疗领域用于自动化图像处理、实验室数据管理和患者数据分析等任务
现有 RPA 平台（如 UiPath、Automation Anywhere）虽易用，但计算密集型任务效率低下：约 78% 的处理时间花在开销上（模型重载、活动转换、数据序列化），仅 22% 用于实际推理
需要一种结合 RPA 工作流编排优势与 Python 高效计算能力的混合方案

方法详解¶

数据集与预处理¶

使用约 3000 张口腔临床图像，分为 4 大类（Healthy、Benign、OPMD、Oral Cancer）和 16 个子类别
数据划分：训练 70%、验证 15%、测试 15%（分层抽样）
预处理：像素归一化到 [0,1]，ImageNet 均值/标准差标准化
数据增强：使用 Albumentations 库，每个训练样本 5 种变换（翻转、旋转、亮度对比度调整、随机裁剪），少于 200 样本的类随机复制

模型架构¶

基于 ImageNet 预训练的 EfficientNetV2B1 作为特征提取器
输入尺寸 224×224×3，顶层添加全连接 Dense + Softmax
两阶段训练：
特征提取阶段：冻结基础层，15 epochs，学习率 1e-3
微调阶段：部分解冻深层，10 epochs，学习率 1e-5
Adam 优化器 + categorical cross-entropy，Batch size 32
Early stopping + ReduceLROnPlateau + 最优验证准确率 checkpoint

RPA 实现对比¶

OC-RPAv1：基于 Python 的顺序 RPA 风格处理，每次加载模型预测一张图像
OC-RPAv2：引入 Singleton + Batch Processing 设计模式
Singleton：模型仅加载一次并保持在内存中，避免重复加载
Batch Processing：批量处理图像，利用 GPU 并行推理
UiPath 管理自动化管道，调用 Python 函数执行推理

工作流同步与安全¶

顺序处理图像批次，逐文件分类和记录后才处理下一个，避免数据碰撞
Try-Catch 异常处理确保工作流连续性
本地安全工作站处理，匿名化文件路径，限制访问权限
处理完成的文件移动到单独目录以确保数据完整性

与已有工作的关系¶

基于 Al-Ali 等人的 CLASEG 框架，该框架集成了多类分类和分割用于口腔病灶的鉴别诊断
延续 Abdellaif 等人的 LMV-RPA 思路，用增强 Python 自动化补充标准 RPA
Kim 等人此前已展示 RPA+Python 混合架构在病理图像癌检测中的加速效果
本文进一步将设计模式（Singleton + Batch）引入该混合架构，量化了加速比

实验关键数据¶

推理速度对比（31 张测试图像）¶

平台	总时间	每张平均时间
UiPath	80 s	2.58 s
Automation Anywhere	75 s	2.42 s
OC-RPAv1 (Python)	8.65 s	0.28 s
OC-RPAv2 (Python+DP)	1.96 s	0.06 s

OC-RPAv2 比 UiPath 快 ~43×，比 Automation Anywhere 快 ~40×
OC-RPAv2 比 OC-RPAv1 快 ~4.4×
设计模式的引入将 Python 管道从 8.65s 压缩到 1.96s

规模化估算¶

2500 张图像：UiPath 需 1.8 小时，OC-RPAv2 不到 3 分钟

亮点¶

工程实用性强：Singleton + Batch Processing 的设计模式组合简单有效，部署门槛低
大幅加速：相比标准 RPA 平台实现 60-100× 加速，具有明显的临床部署价值
成本降低：减少硬件空闲时间和 RPA 许可成本，论文声称 40× 成本降低
混合架构思路：RPA 负责工作流编排，Python 负责计算密集型推理，各取所长
16 类口腔病灶分类：覆盖 Healthy、Benign、OPMD、Oral Cancer 四大类及多个子类别，分类粒度较细

局限性¶

测试集极小：仅 31 张测试图像，统计可信度很低，无法得出可靠的速度基准结论
缺乏分类精度报告：论文聚焦速度对比，未报告模型在测试集上的分类准确率、precision、recall 等关键指标
技术贡献有限：Singleton 和 Batch Processing 是非常基础的软件工程模式，核心"创新"更接近工程优化而非学术贡献
对比不公平：RPA 平台的开销主要来自 GUI 自动化和活动转换，与纯 Python 管道对比本质上是不同范式的比较
写作质量较差：存在重复段落、格式不规范、参考文献不完整等问题
临床验证缺失：未在真实临床环境中部署验证，可扩展性声明缺乏支撑
与 CVPR 水准差距较大：整体工作更像工程报告而非顶会论文，学术深度不足
未与主流口腔癌检测方法对比：缺少与其他 CNN/ViT 检测方法在准确率上的直接对比
数据集细节不足：未报告各子类别的样本分布、增强后的具体数量等关键信息
无消融实验：未单独验证 Singleton 和 Batch Processing 各自的贡献

评分¶

新颖性: ⭐⭐ — Singleton + Batch Processing 是基础设计模式，缺乏方法层面的创新
实验充分度: ⭐ — 31 张测试图像，无分类性能指标，实验设计极不充分
写作质量: ⭐⭐ — 行文冗余重复，格式混乱，多处重复段落
价值: ⭐⭐ — 工程思路有参考意义，但学术贡献不足以支撑顶会发表
综合: ⭐⭐ — 适合作为工程技术报告，不适合作为学术论文参考