VeriMaAS: Automated Multi-Agent Workflows for RTL Design¶
会议: NeurIPS 2025
arXiv: 2509.20182
代码: 有
领域: LLM Agent / 硬件设计
关键词: RTL代码生成, 多agent, 形式化验证, HDL, EDA
一句话总结¶
VeriMaAS 提出自动组合 agent 工作流的框架用于 RTL 代码生成——关键创新是将 HDL 工具的形式化验证反馈直接整合到工作流生成中,无需梯度更新或长推理链,在 pass@k 上超过微调基线 5-7%,且训练样本需求降低一个量级。
研究背景与动机¶
- 领域现状:RTL/HDL 代码生成可用微调 LLM 或大推理模型(如 o4),但前者需要昂贵的 GPU 训练,后者推理成本高。
- 现有痛点:HDL 生态中训练数据远少于软件编程;微调的模型泛化差;推理模型贵。
- 切入角度:用多 agent 框架自动编排工作流,结合 HDL 形式化验证(仿真/综合)的反馈。
- 核心idea一句话:形式化验证反馈 → agent 工作流自动组合 → 少量样本高效生成正确 RTL。
方法详解¶
关键设计¶
- 多 Agent 工作流自动组合:不是手工设计 agent 流程,而是根据任务需求自动选择和排列 agent
- 形式化验证闭环:EDA 工具的综合/仿真结果直接反馈到 agent,指导修正
- 极低监督成本:仅需几百个训练样本(比微调少一个量级)
实验关键数据¶
| 方法 | pass@k | 训练样本 |
|---|---|---|
| 微调基线 | base | ~10K |
| VeriMaAS | +5-7% | ~几百 |
关键发现¶
- 形式化验证反馈比纯 LLM 推理更高效地修正错误
- 自动工作流组合比手工设计的管线更灵活
亮点与洞察¶
- 形式化验证作为 agent 反馈源的思路对硬件设计 AI 有普适价值
- 训练样本的大幅减少使方法在实际 EDA 场景中更可行
局限性 / 可改进方向¶
- 仅在 RTL 代码生成上验证
- 工作流搜索空间可能随任务复杂度快速增长
评分¶
- 新颖性: ⭐⭐⭐⭐ 形式化验证+agent工作流的组合新颖
- 实验充分度: ⭐⭐⭐ 有效但规模较小
- 写作质量: ⭐⭐⭐⭐ 清晰
- 价值: ⭐⭐⭐⭐ 对硬件设计自动化有实用价值