清华大学、香港大学、剑桥大学联手打造:让AI帮你“认识”模拟电路

日期：2026-06-02 12:05 来源：鹏达灯光音响

这项由清华大学、香港大学、剑桥大学以及南京邮电大学联合发布的研究，以arXiv预印本形式于2026年4月25日公开，编号为arXiv:2604.23195，有兴趣深入了解的读者可通过该编号查询完整论文。

电路设计是一门极其依赖经验积累的工程艺术。对于做模拟电路的工程师来说，他们每天面对的工作，有点像一个厨师被要求在一个巨大的图书馆里寻找一道"差不多是这样"的菜谱——图书馆里的食谱有的是手写的，有的是印刷的，有的则是菜品照片，而你偏偏只会用文字搜索。这种跨越不同"语言形式"的寻找，正是当前模拟电路领域最让人头疼的难题之一，而这篇论文正是为了解决这个问题而生的。

研究团队提出了一个名为AnalogRetriever的系统，它能够将电路的三种不同表达形式——文字描述、电路图（原理图）、以及SPICE网表（一种描述电路连接关系的代码格式）——全部"翻译"成同一种"语言"，然后放进同一个空间里进行比较和检索。无论你手里拿着哪种形式的电路信息，都能找到其他形式的对应版本。这在模拟电路领域尚属首次，是一个真正意义上的三模态统一检索框架。

一、模拟电路工程师的日常困境

一个刚入行的模拟电路工程师，如果需要设计一个运算放大器，通常需要做什么？他得翻教科书、查论文、搜索公司内部的设计库，有时候还要在技术论坛上问前辈。更麻烦的是，教科书里给的是电路图，论文里写的是文字描述，设计库里存的是SPICE代码——三种格式各自孤立，彼此之间没有任何桥梁。就算他在教科书里找到了一张心仪的电路图，他也无法直接用这张图去搜索公司库里有没有对应的SPICE代码，只能靠经验或者逐个手动比对。

这种困境在行业里被称为"异构表示"问题。同一个电路，用文字描述时叫"带Miller补偿的两级运放"，用电路图展示时是一堆带箭头的符号，用SPICE代码写出来则是一长串像天书一样的文本。三种形式说的是同一件事，但传统的搜索工具完全不懂这种跨形式的"翻译"——它们只能在同一种格式内做精确的关键词匹配，一旦跨越格式边界就束手无策。

对有经验的老工程师来说，这种信息鸿沟靠多年积累的直觉来弥补。但对于新人来说，这道门槛高得令人沮丧。AnalogRetriever的出发点，就是用人工智能来填平这道鸿沟，让任何人都能用自己手头的任意形式去搜索其他形式的对应设计。

二、数据质量：从一堆"残次品"到精品库

要训练一个能看懂三种格式的AI，首先需要一批高质量的"三件套"样本——每个电路都要同时有文字描述、电路图和SPICE代码，而且三者要准确对应。研究团队选择基于目前公开最大的模拟电路数据集MASALA-Chai进行构建，但这个数据集的质量问题令人意想不到。

MASALA-Chai里大约有6500多个样本，但研究团队仔细检查后发现，其中只有22%的SPICE代码能够在电路仿真器Ngspice中正常编译运行，能通过直流工作点仿真验证的比例更是只有11.4%。剩下的代码要么有语法错误，要么引用了不存在的子电路，要么器件模型缺失，要么节点连接方式错误。更糟糕的是，许多文字描述是"This is a circuit"这样毫无信息量的通用句子，根本无法反映电路的实际功能。

为了解决这个问题，研究团队设计了一个两阶段的自动修复流程，核心工具是大语言模型。第一阶段，把每个有问题的SPICE代码连同Ngspice报出的错误信息一起交给GPT-5.4，让它修复语法和模型引用问题。修复后再跑一遍仿真，通过的留下，不通过的进入第二阶段。第二阶段是更精细的迭代修复：把失败的代码和详细的直流仿真错误日志一并交给一个更谨慎的"教师模型"，让它根据具体的错误信息有针对性地修改，修改后再验证，验证失败则继续追加错误反馈，最多循环5次。此外，对于那些原本就缺少SPICE代码或文字描述的302个样本，AI直接根据电路图生成了对应的两种模态，弥补了数据缺口。

与此同时，文字描述也经历了专门的"重写"步骤：以修复后的SPICE代码为基准，让AI生成不超过60个词的技术性精确描述，要求明确说出电路类型、关键器件和工作原理，彻底替换掉那些无意义的通用句子。

经过这两个阶段，最终得到6354个经过严格验证的三模态样本，编译率从22%提升到100%，直流仿真通过率从11.4%提升到99.7%。这个数据集将随论文代码一并公开。

三、三种语言的"共同翻译器"：框架设计

拿到高质量数据之后，AnalogRetriever需要解决的核心问题是：怎样才能让文字、图片和代码三种完全不同的信息，在同一个数学空间里"比较距离"？

研究团队的思路，类似于给三种截然不同的货币建立一套统一的兑换汇率表。每一种货币都通过自己的"兑换窗口"转换成一种叫做"语义向量"的通用单位，代表同一个电路的三种形式，在这个向量空间里应该非常靠近，而代表不同电路的，无论形式是否相同，都应该相互远离。

对于文字描述和电路图，研究团队使用了OpenAI开发的CLIP模型作为基础。CLIP本是用来做自然图片与文字对齐的，但电路原理图是抽象的线条符号图，和普通照片差异很大。为了让CLIP适应这种新的"方言"，研究团队冻结了CLIP视觉编码器底部的16层，只允许顶部的8层接受训练调整。这样既能保留CLIP已经学会的通用视觉-语言对齐能力，又能让它慢慢适应电路图这种特殊风格，避免"灾难性遗忘"——就像一个英文母语者学习法语时，不会忘记自己的英文一样。

对于SPICE网表，挑战则更独特。SPICE代码本质上是一张图——器件是节点，电连接是边——但它不是普通的图。一个MOSFET晶体管有栅极、漏极、源极、衬底四个端口，连接到栅极意味着"控制输入"，连接到漏极意味着"电流通路"，这两者的电学含义截然不同。普通的图神经网络把所有连接一视同仁，完全无法区分这种差别，就像一个不懂中文的人把"打"字在"打架"和"打扫"里的意思混淆一样。

为此，研究团队采用了一种叫做关系型图卷积网络（RGCN）的结构，它为每种端口类型分配独立的学习权重矩阵。系统定义了20种边类型，覆盖了MOSFET的漏/栅/源/衬底、BJT的集电极/基极/发射极、二极管的阳极/阴极、无源器件R/C/L的各端口、四种受控源端口、以及器件间的共网络连接和子电路接口。这种精细的端口感知能力，让RGCN能够区分同样拓扑下的共源放大器和源极跟随器——这两个电路长得相似，但功能完全不同，区别就在于MOSFET漏极和源极的连接方式。

每个器件节点的特征由两部分融合而成：一部分是离散的器件类型编码（比如"这是NMOS管"），另一部分是经过对数归一化处理的连续参数向量（比如W/L比值、电阻值、电容值）。经过两层RGCN消息传递和一个可学习的注意力池化层，整个网表被压缩成一个向量，其中功能关键的器件（输入差分对、输出级、偏置参考）获得更高的关注权重，而不重要的"样板"器件则被自然淡化。最后，一个两层MLP投影头把这个向量映射到与CLIP相同的768维空间，完成"换算"。

四、对比学习：让"相似"靠近，让"不同"远离

三个编码器产出的向量，如何训练成真正反映语义相似度的表示？答案是对比学习——一种"推拉游戏"：把同一个电路的三种表示向量彼此推近，把不同电路的向量相互推远。

具体采用的是InfoNCE损失函数，对每一对模态组合（电路图-文字、文字-网表、电路图-网表）分别计算"从A找B"和"从B找A"两个方向的损失，六个方向全部加总。这种六向全覆盖的训练方式带来了一个意外的惊喜：加入网表这第三个模态之后，原本只有文字和图片两个模态的方向（Text→Image、Image→Text）的检索准确率也跟着提升了，最多提升了8.7个百分点。原因在于，网表携带的拓扑结构信息为整个语义空间提供了额外的"锚点"，让文字和图片的对齐也变得更加精准，三种模态互相强化。

除了主要的对比损失之外，研究团队还加入了一个辅助的电路类型分类任务。通过大语言模型标注，数据集里的每个样本被归入19个经典模拟电路类别，涵盖放大器、电流镜、运放/OTA、带隙基准、压控振荡器（VCO）、比较器、低压差稳压器（LDO）、滤波器和无源网络等家族。一个共享的两层分类器同时作用于文字和网表的向量，要求它们预测出正确的类别，这迫使两种模态在编码高层拓扑信息上保持一致。

五、三阶段课程学习：从简单到困难的渐进训练

直接把一个随机初始化的RGCN和一个预训练好的CLIP放在一起同时训练，是一个非常危险的操作。随机初始化的RGCN产出的向量毫无意义，如果把它强行拉进CLIP的语义空间，只会把CLIP已经建立好的文字-图片对齐关系打乱，训练会迅速崩溃。这就好比一个幼儿园小朋友突然被拉进了博士生讨论课，不仅自己什么都学不到，还会打扰其他人的讨论。

为此，研究团队设计了一个三阶段的课程训练流程，循序渐进地将三个编码器整合到一起。

第一阶段是图编码器的预热期，持续6个轮次。在这一阶段，CLIP的文字和图片编码器完全冻结，只让RGCN独自学习，目标是把网表向量对齐到CLIP已经建立好的语义空间里，损失函数只包含网表-图片和网表-文字两个方向。这个阶段就像新来的翻译官先安静地学习现有会议室的说话方式，而不是贸然改变整个会议室的规则。

第二阶段是过渡期，持续2个轮次。CLIP的参数被解冻，六个方向的全量对比损失全部开启，但采样策略仍然是随机的——每个批次里的负样本都是随机选取的。优化器重新初始化，配备独立的学习率预热和余弦衰减调度，目的是建立一个稳定的联合优化轨迹，为下一阶段的困难样本挖掘做好准备。

第三阶段是课程化困难负样本挖掘阶段，持续12个轮次，也是最关键的阶段。研究团队先用句子嵌入模型把所有电路的文字描述编码成向量，然后用K-means聚类算法把6354个样本分成30个"功能簇"——同一个簇里的电路在功能上相近，比如都是两级运放、都是电流镜等。

训练时，每个批次里的负样本有一部分来自同一功能簇内的其他电路（困难负样本），剩余部分来自全局随机抽取（简单负样本）。困难负样本的比例从5%开始，按线性调度逐步增长到30%。这种安排迫使模型学会区分那些"长相相似但功能不同"或者"功能相近但实现方式不同"的电路，比如Miller补偿两级运放和折叠共源共栅运放——两者都是运放家族成员，文字描述高度相似，但晶体管级的拓扑完全不同。

六、实验结果：数字背后的真实意义

研究团队用1000个样本组成的测试集来评估AnalogRetriever的表现，衡量指标是Recall@K，即在K个检索结果中，正确答案出现的比例。

与所有对比基线相比，AnalogRetriever的优势极为显著。直接把原始SPICE代码送入CLIP文字编码器做零样本检索，六个方向平均Recall@1只有2.5%——基本等同于随机猜测。CROP方法先用Qwen2.5-7B把网表总结成自然语言再编码，把Text→Code方向的Recall@1提升到了9.5%，算是迄今为止最强的基线，六方向平均达到4.7%。ChatLS和NetTAG的表现更弱，分别为4.0%和1.0%。

AnalogRetriever的六方向平均Recall@1达到75.2%，比最强基线CROP高出15倍以上。具体到各个方向：文字找网表（T→C）达到75.6%，网表找图片（C→I）达到72.0%，图片找网表（I→C）达到74.7%，文字找图片（T→I）达到78.2%，图片找文字（I→T）达到78.5%，网表找文字（C→T）达到72.4%。更值得注意的是，所有方向在Recall@5上都超过了94%，在Recall@10上都超过了97%——这意味着用户的一次查询，几乎必然能把正确答案包含在前10个结果里。

消融实验进一步验证了各个设计选择的贡献。仅使用文字和图片两个模态（TI双模态基线）时，文字找图片和图片找文字方向的Recall@1分别为70.5%和69.8%，而加入网表第三模态后分别提升到78.2%和78.5%。但有趣的是，如果只是简单地把随机初始化的RGCN加进去而不做课程训练（TIC-GCN变体），Text→Image的Recall@1几乎没变（70.5→70.8），说明课程训练是让第三模态真正发挥作用的关键。从TIC-RGCN（无课程训练，六方向平均67.7%）到完整的AnalogRetriever（75.2%），课程学习贡献了7.5个百分点的提升，其中代码相关方向的提升最为突出（I→C提升9.5，C→I提升10.1）。将GCN替换为端口感知的RGCN带来了额外1.6个百分点的平均提升，主要集中在代码相关方向。

七、接入大语言模型代理：让检索变成设计加速器

检索能力本身很有价值，但研究团队更进一步，把AnalogRetriever接入了AnalogCoder——一个用大语言模型自动生成模拟电路PySpice代码的代理框架——验证它在真实设计任务中的实用价值。

具体的流水线是这样运作的：把设计需求的文字描述扩展成拓扑感知的详细描述，送入AnalogRetriever做Text→Code检索，从预建的FAISS向量索引里找出前K个最相似的SPICE网表，经过一个规则解析器转换成PySpice格式，然后作为示例注入到大语言模型的提示词里，引导它生成正确的电路代码。检索结果在注入之前还经过三层过滤：相似度阈值过滤、器件类型过滤、拓扑优先排序，确保注入的参考样例质量。

查询扩展这个环节值得特别说明。AnalogCoder的任务描述通常非常简短，比如"A Wien Bridge oscillator"只有短短几个词，CLIP的文字编码器对这种高度压缩的描述产出的向量区分度很差，导致正确的数据库条目排在很靠后的位置（比如维恩桥振荡器的相关条目排在第74、56、20位）。研究团队让GPT-5.4把每个简短任务描述扩展成一段拓扑感知的详细说明，扩展后检索排名大幅提前（同样的条目跑到了第2、10、5位），Miller补偿运放的条目更是直接从第35位跳到第1位。24个任务的扩展工作只需要一次性完成，成本可以忽略不计。

在AnalogCoder的24任务基准测试上，研究团队对比了8个不同的大语言模型加入和不加入AnalogRetriever的表现。结果显示，8个模型无一例外地在加入检索增强后性能提升，平均绝对提升5.6个百分点（从62.0%到67.6%）。GPT-4o-mini的提升最为显著，达到了10个百分点；Claude Sonnet 4.6本来已经是最强基线（84.2%），加入检索后进一步提升到86.7%，创下新的最高分。这种普适性提升跨越了不同规模、不同家族的模型，说明检索增强带来的好处并不依赖于某一个特定的大模型。

案例分析进一步说明了检索的具体作用。在一个设计Miller补偿运放的任务里，Claude Sonnet 4.6在没有检索支持时生成了一个差分对带电流镜负载但没有共模反馈的电路，高阻抗节点会漂移进入三极管区，5次尝试全部失败。获得一个单端CMOS Miller运放的检索结果作为参考后，大模型按照M1→M3的经典拓扑复现，正确添加了Miller补偿电容，5次全部成功。在另一个设计维恩桥振荡器的任务里，GPT-5.4-mini在没有参考时生成了错误的RC网络结构，反馈环路断开，5次全部失败；获得正确的维恩桥拓扑参考后，模型构造了正确的正负反馈闭环，4次成功。这两个案例清晰地表明，一个高质量的参考样例，就足以把一个完全错误的生成方向扭转为可靠的成功输出。

说到底，AnalogRetriever做的事情，是在模拟电路的三种"方言"之间建起了一座真正意义上的桥梁。过去工程师需要靠多年经验和直觉才能在不同格式的设计文档之间游走，现在这种跨语言的"翻译能力"可以被编码进一个系统，供所有人使用。75.2%的六方向平均Recall@1，97%以上的R@10覆盖率，以及在8个大模型上一致的性能提升，都指向同一个结论：这套框架是可用的、实用的，而不只是实验室里的概念验证。

当然，研究也坦诚地列出了尚待完善的方向。当前的数据集覆盖了19种经典模拟拓扑，混合信号、射频和电源管理电路暂未纳入。RGCN使用的20种端口类型是人工定义的，未来可以探索从数据中自动学习关系类型，提升对新型器件技术的泛化能力。随着电路数据库规模扩大到工业级，向量检索的效率优化（比如乘积量化）也会成为不可回避的工程问题。研究团队计划在论文接收后公开数据集和模型权重，感兴趣的读者届时可以通过arXiv编号2604.23195追踪后续进展。

归根结底，模拟电路设计是一个知识密集型领域，经验的传递一直是瓶颈。AnalogRetriever不是要取代工程师的判断，而是要让知识的流通变得更顺畅——让前人积累的设计智慧，能够更高效地被后人所用。

Q&A

Q1：AnalogRetriever能做什么，跟普通的电路搜索工具有什么区别？

A：AnalogRetriever能够跨越文字描述、电路原理图和SPICE代码三种完全不同的格式进行相互检索。普通的搜索工具只能在同一种格式内做关键词匹配，比如用文字搜文字。AnalogRetriever则可以用一段文字描述去找对应的电路图和代码，或者拿一张电路图去找功能相似的代码和说明，实现了真正意义上的跨格式语义检索。

Q2：MASALA-Chai数据集原来为什么只有22%的代码能运行？

A：原始数据集存在多种质量问题，包括引用了不存在的子电路定义、缺少器件的SPICE模型声明、节点连接错误等语法和逻辑问题。此外许多文字描述内容空洞，缺乏实际信息量。这些问题导致大多数代码无法通过电路仿真器的编译和直流仿真验证。

Q3：AnalogRetriever的三阶段课程训练为什么不能简化成一步到位的训练？

A：因为图神经网络（RGCN）是随机初始化的，而CLIP已经经过大规模预训练，二者直接放在一起联合训练时，随机初始化的RGCN产出的无意义向量会干扰CLIP已有的文字-图片对齐结构，导致整体训练崩溃。三阶段设计先让RGCN独立预热对齐到CLIP空间，再逐步开放联合训练，最后引入困难样本，每步都在上一步稳定基础上推进，避免了训练不稳定问题。

免责声明：本站内容来源于互联网公开信息，仅供学习和参考使用。如涉及版权问题，请联系我们，我们将在核实后第一时间删除相关内容。

标签： 会议系统排名

清华大学、香港大学、剑桥大学联手打造:让AI帮你“认识”模拟电路

资讯导航

关于我们

联系方式

服务说明

清华大学、香港大学、剑桥大学联手打造:让AI帮你“认识”模拟电路

相关报道

资讯导航

关于我们

联系方式

服务说明