AMS-IO-Bench and AMS-IO-Agent: Benchmarking and Structured Reasoning for Analog and Mixed-Signal Integrated Circuit Input/Output Design¶

会议: AAAI 2026
arXiv: 2512.21613v1
代码: https://github.com/Arcadia-1/AMS-IO-Agent / https://github.com/Arcadia-1/AMS-IO-Bench
领域: LLM Agent / EDA自动化 / 模拟与混合信号IC设计
关键词: LLM Agent, AMS IC, I/O Ring, EDA自动化, 结构化推理

一句话总结¶

提出AMS-IO-Agent，一个基于LLM的领域专用智能体，通过结构化意图图(Intent Graph)和领域知识库将自然语言设计意图转化为可生产的模拟混合信号IC I/O环设计，配套提出首个AMS I/O环自动化基准AMS-IO-Bench，在28nm CMOS流片中验证了智能体生成的I/O环可直接用于实际芯片制造。

背景与动机¶

模拟与混合信号(AMS) IC的输入/输出(I/O)子系统负责信号接口、供电和ESD保护，是芯片的基础组件。与数字I/O可通过脚本自动化不同，AMS I/O设计因涉及多种信号类型、多电源域、功率完整性约束、敏感模拟信号布线等复杂需求，至今仍高度依赖人工。一个新手工程师可能需要花1-2天来手动组装和验证I/O的摆放与连接，而迭代改引脚更是工作量巨大。

现有LLM在IC设计方面的应用（RTL代码生成、网表合成等）没有覆盖AMS I/O这一领域，原因有三：(1) 领域知识碎片化，分散在团队内部文档中；(2) 缺乏标准化任务接口，设计师通过GUI或领域专用语言交互，LLM难以直接介入；(3) 缺乏公开基准。

核心问题¶

如何让LLM理解非结构化的引脚规划描述（自然语言、表格等），并自动生成满足DRC(设计规则检查)和LVS(版图与原理图一致性检查)的、可直接用于流片的AMS I/O环设计？核心挑战在于：LLM无法直接生成质量可靠的EDA脚本（如Cadence SKILL），简单的端到端代码生成在这种约束密集、领域专用的任务上完全失败。

方法详解¶

整体框架¶

AMS-IO-Agent采用三层分层架构：用户提供引脚规划文本 → LLM将其结构化为Intent Graph(意图图) → Intent Graph Adaptor(适配器)将意图图解析为可执行的EDA脚本(SKILL/csh) → 在Cadence Virtuoso中生成原理图和版图 → 调用Calibre进行DRC/LVS验证。整个过程将高层意图推理与底层实现分离，LLM专注于理解设计意图，确定性模块负责约束求解和脚本生成。

关键设计¶

设计意图结构化(Design Intent Structuring): 将非结构化的引脚规划（自然语言描述、引脚列表、半结构化表格）转换为标准化的Intent Graph——一种JSON格式的图表示。每个节点代表一个pad或corner cell，包含名称、器件类型、空间位置、方向、引脚连接等属性。构建过程分两步：显式补全——根据引脚名命名规范（如DCLK=数字时钟、VCM=共模电压）通过知识库推断信号类型、器件类型、默认方向等属性；隐式推理——自动插入设计规范中未提及但必需的元素如corner cell。Intent Graph不同于网表：网表只描述电路连接，而Intent Graph还捕获空间关系、语义上下文和领域知识，可同时被人和LLM理解，也能被代码高效解析。
意图图适配器(Intent Graph Adaptor): 作为LLM与商业EDA工具之间的中间件层。为什么不让LLM直接生成SKILL脚本？因为SKILL训练数据极度匮乏，LLM无法可靠生成，同时SKILL本身也不适合复杂数据操作。适配器用Python实现确定性处理：结构化数据解析、约束求解、几何计算（如根据I/O设计规则精确计算每个cell的坐标）、SKILL脚本生成（用于Cadence Virtuoso创建原理图和版图）、csh脚本生成（用于调用Calibre验证工具）。这些工具被封装为可复用的工具库，供Agent按需调用，而非每次由LLM重新生成。
领域专用知识库(Domain-Specific Knowledge Base): 从一个10+人的专业AMS IC设计团队的培训材料和设计实践中提炼而来，经过50+次流片验证。涵盖器件选型实践、版图惯例、电源域规则、ESD保护要求、命名规范等。整个知识库仅约6k tokens，足够紧凑到可以直接作为LLM的上下文输入，无需RAG检索或模型微调。这些知识和培训新工程师用的材料相同，本科背景的工程师1-3天即可掌握。

训练策略¶

本文方法不需要训练或微调LLM，而是通过prompt engineering将知识库注入上下文，结合结构化推理流程实现零样本设计自动化。使用smolagents框架，通过API调用GPT-4o/Claude-3.7/DeepSeek-V3等骨干模型。

实验关键数据¶

AMS-IO-Bench基准¶

从10个真实流片项目中构建30个测试用例，分三个难度级别： - 简单(10例)：单信号域，小规模 - 中等(10例)：多电源域(数字+模拟)，标准MPW芯片~1mm×1mm，需要跨域推理 - 困难(10例)：双排/交错pad、放大chip outline、定制I/O cell、专用ESD供电等

五项评估指标¶

Intent Graph正确率 → Shape Score(VLM视觉评估) → DRC通过率 → LVS通过率 → DRC+LVS通过率

方法	IG(%)	Shape(%)	DRC(%)	LVS(%)	DRC+LVS(%)	时间(min)	Token(k)
人工设计	100	100	100	100	100	~480	–
直接LLM(GPT-4o)	0	0	0	0	0	0.2	1k
AMS-IO-Agent(GPT-4o)	100	100	76.67	66.67	63.33	4.1	160k
AMS-IO-Agent(Claude-3.7)	100	100	93.33	76.67	76.67	4.2	96k
AMS-IO-Agent(DeepSeek-V3)	100	100	93.33	76.67	76.67	5.1	105k

按难度级别DRC+LVS通过情况¶

模型	简单	中等	困难
GPT-4o	10/10	7/10	2/10
Claude-3.7	10/10	9/10	4/10
DeepSeek-V3	10/10	10/10	3/10

消融实验要点¶

仅用知识库(KB)不用Intent Graph和Adaptor → 0% DRC+LVS，LLM直接生成SKILL完全失败
KB + Adaptor但不用Intent Graph(LLM直接生成Python代码) → Shape 100%但DRC仅20%，LVS 0%
KB + Intent Graph但不用Adaptor → Intent Graph 100%但无法生成可用版图
三个组件缺一不可：完整配置(KB+IG+Adaptor)达到93.33% DRC、76.67% DRC+LVS
直接LLM生成代码和结构化意图推理的差距极大，证明了中间表示的必要性

亮点¶

首次LLM Agent在真实芯片流片中发挥实质作用：28nm CMOS流片验证，Agent生成的I/O环直接用于硅片制造并通过功能验证，这是首个LLM Agent完成非平凡AMS IC设计子任务并直接用于流片的报道
结构化中间表示的精妙设计：Intent Graph同时对人和机器友好——人能看懂、LLM能生成、代码能解析，解决了LLM不擅长直接生成EDA DSL的根本问题
工程效率提升巨大：从人工设计约480分钟/案例降至~5分钟，token消耗控制在100k量级
可迁移的Agent架构思路：将高层意图理解(LLM擅长)与底层确定性执行(工具擅长)分离的架构，可迁移到其他需要LLM与专业工具协作的领域

局限性 / 可改进方向¶

仅覆盖wirebond封装的AMS I/O环，未涉及flip-chip等其他封装方式
知识库绑定特定设计惯例和工艺节点，迁移到其他foundry规则需要替换知识库
最高76.67%的DRC+LVS通过率说明仍有约1/4的设计需要人工修正，尤其是Hard级别案例
30个测试用例的基准规模偏小（但作者论证了AMS IC领域的数据量限制是合理的）
未探索更复杂的AMS设计任务（如完整版图布线、模拟电路优化等）

与相关工作的对比¶

vs. 现有EDA自动化工具（如Yosys padring工具）：现有工具需要设计师编写详细配置表，自动化程度低，且基本面向数字SoC不支持AMS需求。本文通过自然语言接口和领域知识推理，真正实现了"理解设计意图"级别的自动化
vs. LLM for IC Design的其他工作（如ChipNeMo、RTL代码生成等）：现有工作集中在数字设计（RTL生成、网表合成），未触及AMS I/O这一高度手工化的环节。本文首次将LLM Agent引入AMS IC领域并实现流片级验证
vs. 直接LLM代码生成：消融实验表明直接让LLM生成SKILL代码完全失败(0% pass rate)，证明了结构化意图中间表示的必要性

启发与关联¶

"LLM做高层推理 + 确定性工具做底层执行"的Agent架构模式值得关注，适用于任何需要将自然语言意图转化为精确技术产出的场景
Intent Graph作为人机共读的中间表示的设计思路，可迁移到其他工程自动化领域
知识库的compact设计（~6k tokens直接in-context）避免了RAG的复杂性，在专业领域知识规模有限时是更实用的方案

评分¶

新颖性: ⭐⭐⭐⭐ 首次将LLM Agent引入AMS IC I/O设计并完成流片验证，问题定义新颖但Agent架构本身并不特别创新
实验充分度: ⭐⭐⭐⭐ 消融实验设计合理，有真实28nm流片case study验证，但基准规模偏小(30例)
写作质量: ⭐⭐⭐⭐ 问题动机、方法设计和实验分析都讲得清楚，图表质量高
价值: ⭐⭐⭐⭐ 对AMS IC设计自动化有重要推动，但应用范围较窄，主要面向IC设计从业者