Novel Architecture of RPA In Oral Cancer Lesion Detection¶

会议: CVPR 2026 arXiv: 2603.10928 代码: 无领域: 医学图像 关键词: 口腔癌检测、RPA自动化、EfficientNetV2、设计模式、CNN分类

一句话总结¶

将软件设计模式（Singleton + Batch Processing）集成到基于 EfficientNetV2B1 的口腔癌病变检测 Python 流水线中，相比传统 RPA 平台（UiPath/Automation Anywhere）实现 60-100 倍的推理加速，同时保持诊断准确性。

研究背景与动机¶

口腔癌的早期精准检测对诊断和治疗至关重要。当前临床工作流面临主观判断、流程延迟和决策不一致等挑战。RPA（机器人流程自动化）已被引入医疗工作流以自动化重复任务，但传统 RPA 平台（UiPath、Automation Anywhere）存在严重的计算效率问题：

执行开销大：约 78% 的处理时间用于模型重复加载、活动切换和数据序列化，仅 22% 用于推理
不支持批处理：串行的图像处理方式导致瓶颈
计算资源利用低效：低代码环境对计算密集型任务支持不足

本研究的动机是通过将软件工程设计模式引入 Python 自动化流水线，在保持 RPA 工作流编排优势的同时大幅提升推理效率。

方法详解¶

整体框架¶

系统分为两条并行流水线（如 Fig.1）： - OC-RPAv1：基本 Python 流水线，按 RPA 风格逐张处理图像 - OC-RPAv2：优化流水线，引入 Singleton + Batch Processing 设计模式；UiPath 管理自动化流水线，调用 Python 函数执行推理

两条流水线最终收敛于同一个 CNN 模型进行预测。

关键设计¶

CNN 分类模型（EfficientNetV2B1）：以 ImageNet 预训练的 EfficientNetV2B1 为特征提取器，输入尺寸 224×224×3，末层替换为 softmax 全连接层。训练分两阶段：第一阶段冻结 backbone 训 15 epochs（lr=1e-3），第二阶段部分解冻 fine-tune 10 epochs（lr=1e-5）。使用 Adam 优化器 + categorical cross-entropy 损失。数据集含约 3000 张口腔临床图像，覆盖 Healthy/Benign/OPMD/Oral Cancer 共 16 个子类别。
Singleton 设计模式：模型仅加载一次并驻留内存，避免传统 RPA 中每次预测重新加载模型的巨大开销。这是最关键的优化——消除了占总时间 78% 的模型加载和数据序列化开销。
Batch Processing 设计模式：将多张图像组成批次一次性送入模型推理，充分利用 GPU 并行计算能力，减少空闲时间。每张图像处理完成后自动记录结果并移至独立目录，确保数据完整性。

损失函数 / 训练策略¶

损失函数：Categorical cross-entropy
数据增强：使用 Albumentations 库对训练集每样本施加 5 种变换（翻转、旋转、亮度对比度调整、随机裁剪），图像统一 resize 到 224×224
类别不平衡处理：分层采样（70%训练/15%验证/15%测试）+ 对少于 200 样本的类别进行随机复制 + 过采样
训练技巧：Early stopping、模型检查点（保存最佳验证精度）、ReduceLROnPlateau（loss 停滞时学习率减半）、batch size=32

实验关键数据¶

主实验¶

平台/方法	31张图总耗时	平均每张耗时	相对加速比
UiPath	80 s	2.58 s	1× (基线)
Automation Anywhere	75 s	2.42 s	1.07×
OC-RPAv1 (Python)	8.65 s	0.28 s	9.2×
OC-RPAv2 (Python+设计模式)	1.96 s	0.06 s	43×

消融实验¶

配置	关键指标	说明
RPA 平台开销分析	~78% 时间用于非推理操作	模型加载/数据序列化是主要瓶颈
Singleton 效果	模型仅加载 1 次	消除重复加载开销
Batch Processing 效果	GPU 利用率大幅提升	OC-RPAv1→v2 进一步 4.7× 加速
规模化估算	2500张图：UiPath 需 1.8h，v2 不到 3min	40× 运营效率提升

关键发现¶

RPA 平台在计算密集任务上效率极低，大部分时间消耗在非推理开销上
Singleton 模式消除模型重复加载是最大的性能提升来源
设计模式的引入不影响诊断准确性，仅优化执行效率
混合方案（Python 负责计算 + RPA 负责流程编排）是最佳实践

亮点与洞察¶

首次将 Singleton 和 Batch Processing 软件设计模式系统性引入 RPA 医学图像分析流水线
揭示了传统 RPA 平台在 AI 推理场景下的效率瓶颈（78% 开销用于非推理）
提供了一个 RPA + Python 混合自动化的可复用模式

局限性 / 可改进方向¶

数据规模小：仅 31 张测试图像，统计说服力不足
缺乏准确性对比：未报告分类准确率/精度/召回率等指标，缺少不同方法间的诊断性能对比
模型本身无创新：直接使用 EfficientNetV2B1，无架构改进
写作质量不高：结构松散，存在重复段落，相关工作引用不够严谨
应用场景有限：仅关注推理速度，未涉及模型准确性、可解释性等临床关键需求
未来可探索 Factory/Adapter/Observer 等更多设计模式的集成

评分¶

新颖性: ⭐⭐ 将已有设计模式应用于 RPA 流水线，算法层面无创新
实验充分度: ⭐⭐ 测试规模极小，缺乏准确性指标对比
写作质量: ⭐⭐ 结构松散，重复段落较多，部分引用不规范
价值: ⭐⭐⭐ 对 AI 临床部署的工程实践有参考意义，但学术贡献有限