跳转至

VeriMaAS: Automated Multi-Agent Workflows for RTL Design

会议: NeurIPS 2025
arXiv: 2509.20182
代码: 有
领域: LLM Agent / 硬件设计
关键词: RTL代码生成, 多agent, 形式化验证, HDL, EDA

一句话总结

VeriMaAS 提出自动组合 agent 工作流的框架用于 RTL 代码生成——关键创新是将 HDL 工具的形式化验证反馈直接整合到工作流生成中,无需梯度更新或长推理链,在 pass@k 上超过微调基线 5-7%,且训练样本需求降低一个量级。

研究背景与动机

  1. 领域现状:RTL/HDL 代码生成可用微调 LLM 或大推理模型(如 o4),但前者需要昂贵的 GPU 训练,后者推理成本高。
  2. 现有痛点:HDL 生态中训练数据远少于软件编程;微调的模型泛化差;推理模型贵。
  3. 切入角度:用多 agent 框架自动编排工作流,结合 HDL 形式化验证(仿真/综合)的反馈。
  4. 核心idea一句话:形式化验证反馈 → agent 工作流自动组合 → 少量样本高效生成正确 RTL。

方法详解

关键设计

  1. 多 Agent 工作流自动组合:不是手工设计 agent 流程,而是根据任务需求自动选择和排列 agent
  2. 形式化验证闭环:EDA 工具的综合/仿真结果直接反馈到 agent,指导修正
  3. 极低监督成本:仅需几百个训练样本(比微调少一个量级)

实验关键数据

方法 pass@k 训练样本
微调基线 base ~10K
VeriMaAS +5-7% ~几百

关键发现

  • 形式化验证反馈比纯 LLM 推理更高效地修正错误
  • 自动工作流组合比手工设计的管线更灵活

亮点与洞察

  • 形式化验证作为 agent 反馈源的思路对硬件设计 AI 有普适价值
  • 训练样本的大幅减少使方法在实际 EDA 场景中更可行

局限性 / 可改进方向

  • 仅在 RTL 代码生成上验证
  • 工作流搜索空间可能随任务复杂度快速增长

评分

  • 新颖性: ⭐⭐⭐⭐ 形式化验证+agent工作流的组合新颖
  • 实验充分度: ⭐⭐⭐ 有效但规模较小
  • 写作质量: ⭐⭐⭐⭐ 清晰
  • 价值: ⭐⭐⭐⭐ 对硬件设计自动化有实用价值