跳转至

📚 AI Paper Notes

VeriMaAS: Automated Multi-Agent Workflows for RTL Design

VeriMaAS: Automated Multi-Agent Workflows for RTL Design¶

会议: NeurIPS 2025
arXiv: 2509.20182
代码: 有
领域: LLM Agent / 硬件设计
关键词: RTL代码生成, 多agent, 形式化验证, HDL, EDA

一句话总结¶

VeriMaAS 提出自动组合 agent 工作流的框架用于 RTL 代码生成——关键创新是将 HDL 工具的形式化验证反馈直接整合到工作流生成中，无需梯度更新或长推理链，在 pass@k 上超过微调基线 5-7%，且训练样本需求降低一个量级。

研究背景与动机¶

领域现状：RTL/HDL 代码生成可用微调 LLM 或大推理模型（如 o4），但前者需要昂贵的 GPU 训练，后者推理成本高。
现有痛点：HDL 生态中训练数据远少于软件编程；微调的模型泛化差；推理模型贵。
切入角度：用多 agent 框架自动编排工作流，结合 HDL 形式化验证（仿真/综合）的反馈。
核心idea一句话：形式化验证反馈 → agent 工作流自动组合 → 少量样本高效生成正确 RTL。

方法详解¶

关键设计¶

多 Agent 工作流自动组合：不是手工设计 agent 流程，而是根据任务需求自动选择和排列 agent
形式化验证闭环：EDA 工具的综合/仿真结果直接反馈到 agent，指导修正
极低监督成本：仅需几百个训练样本（比微调少一个量级）

实验关键数据¶

方法	pass@k	训练样本
微调基线	base	~10K
VeriMaAS	+5-7%	~几百

关键发现¶

形式化验证反馈比纯 LLM 推理更高效地修正错误
自动工作流组合比手工设计的管线更灵活

亮点与洞察¶

形式化验证作为 agent 反馈源的思路对硬件设计 AI 有普适价值
训练样本的大幅减少使方法在实际 EDA 场景中更可行

局限性 / 可改进方向¶

仅在 RTL 代码生成上验证
工作流搜索空间可能随任务复杂度快速增长

评分¶

新颖性: ⭐⭐⭐⭐ 形式化验证+agent工作流的组合新颖
实验充分度: ⭐⭐⭐ 有效但规模较小
写作质量: ⭐⭐⭐⭐ 清晰
价值: ⭐⭐⭐⭐ 对硬件设计自动化有实用价值