EDA云实证Vol.13:暴力堆机器之王——Calibre

news2024/9/25 7:17:16

Siemens的Calibre是业内权威的版图验证软件,被各大Foundry厂广泛认可。用户可以直接在Virtuoso界面集成Calibre接口,调用版图验证结果数据,使用起来极为方便。

今天,我们就来聊聊这款软件。

版图验证是芯片设计中非常重要的一环,一共包括三个环节。

DRC(Design Rule Check):检查版图是否符合Foundry厂的制造工艺规则,确保芯片能被正确生产出来;

LVS(Layout Versus Schematic):版图工程师需要将画好的版图与原理图对比,确保两者所有连接保持一致;

寄生参数提取(Parasitic Extraction):将版图中的寄生参数提取出来,在Virtuoso中反馈结果,前端工程师会进行后仿验证,重新评估电路特性并进行修改,保证流片正确。

这三个环节分别由Calibre的DRC、LVS、PEX三种工具来完成。

Calibre任务典型特性:重内存,可拆分,适合暴力堆机器

Calibre任务有两大特性:

1、重内存需求,2T或4T的超大型内存机器都有可能登场

版图文件很大,需要处理的数据量非常大,但本身的逻辑判断并不复杂,所以通常不刚需高主频机型,但要求多核、大内存的机器。CPU与内存的比例通常能达到1:4或1:8,极端情况下这个比例会更高,2T或4T的超大型内存机器都有可能登场。

我们在下面两篇文章里仔细盘过模拟&数字芯片设计全流程的业务场景、常用EDA工具、资源类型、算力需求、典型场景:

芯片设计五部曲之一 | 声光魔法师——模拟IC

芯片设计五部曲之二 | 图灵艺术家——数字IC

2、可拆分,无关联,适合暴力堆机器

我们在模拟这篇文里写过版图验证就像是一个“大家来找茬“的游戏。

在运行任务的时候,Calibre会把版图切分成相互没有逻辑关系的块状分区,这些分区之间彼此没有相关性,互不干扰,所以可以同时进行。

切得越细,同时检查的人更多,效率就越高。

三体里的切法大家还记得吧,一字横切。

而芯片只能竖着切,可以十字切法。横切会影响到芯片层与层之间的连接关系。

暴力堆机器也是有技术含量的

1、 首先,要有光,你得有大内存的机器

我们的全球资源池可以根据用户需求在全球范围内调度海量云端异构资源。GPU、TPU、FPGA,要啥都有。

其中,FCC-B产品提供准动态资源池,拥有行业特需的大内存机型,具有较低的整体拥有成本。而且,可以扩展到FCC-E使用弹性资源。

总之,大内存的机器,没有问题。

那么,万一不是一直不够,是偶尔不够怎么办呢?

我们有一个小技巧,专门应用这种内存峰值场景

Swap,交换分区,就是在内存不够的情况下,操作系统先把内存中暂时不用的数据,存到硬盘的交换空间,腾出内存来让别的程序运行。

比如跑一组Calibre任务需要10小时,其中9个小时的内存使用量都在200G左右,只有1个小时达到了260G。

如果选择256G内存的机型配置,任务必崩无疑。

但要是为了这1小时不到10G的内存溢出而全程使用512G的配置,成本翻倍,未免有点太不划算了。

使用Swap交换分区就可以无缝填补这一空缺,非常匹配这种内存峰值场景。

Swap的具体使用案例,戳这篇:Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

注意:此方法不适合长期使用,磁盘的速度和内存相比慢了好几个数量级,如果不停读写 Swap,对系统整体性能有影响。

2、 怎么把这些机器组队管理起来?

有了机器,下一步当然是要把它们利用起来。

Calibre默认支持单机多核并行跑任务,这意味着只要机器足够大,就可以同时处理很多任务。

但是,当你的大机器不够多,或者根本拿不到大机器的时候,就很苦恼了。

我们的方法是:将所有机器组成一个集群——多机多核的方式同时跑多个任务

关于单机、单核、单任务、多任务、集群化、并行化进一步的定义与区别,可以看这篇:揭秘20000个VCS任务背后的“搬桌子”系列故事

集群自动化管理,少量大机器需要,大量小机器就更需要了。

为啥?

理由一,能方便地自动化运维整个集群

比如软件安装配置、资源监控、集群管理等工作,是需要IT一台台机器去逐一手动操作,还是鼠标点几下就可以完成?

理由二,能快速方便地分配业务,提高资源利用率

比如,临时需要将一批机器从团队A划拨给团队B使用,有没有什么办法可以让IT快速方便地进行配置?

比如,因为资源使用的不透明和缺乏有序管理,会出现不同人对同一资源的争抢,任务排队等现象。同时,你会发现资源利用率还是不高。

3、怎么让机器自动化干活,不用人操心?

自动化干活可太有必要了。

否则,那么多任务,那么多机器,需要多少双手和眼睛才能忙得过来?

来,我们给你“手”和“眼睛”。

首先是我们的“手”——Auto-Scale功能

来看一下本地手动跑任务Auto-Scale自动化跑任务的区别:

基于我们自主研发的调度器——Fsched,Auto-Scale自动伸缩功能自动化创建集群,自动监控用户提交的任务数量和资源需求,动态按需地开启与关闭所需算力资源,做到分钟级弹性伸缩,在提升效率的同时有效降低成本。

更多疗效,戳这篇:Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

有了“手”干活,还得有“眼睛”盯着防止出错。

我们能多维度监控任务状态,提供基于EDA任务层的监控、告警、数据统计分析功能与服务。

如果没有这双“眼睛”,可能出现哪些问题?戳这篇:【案例】95后占半壁江山的浙桂,如何在百家争鸣中快人一步

未来我们还会有一篇文章专门讨论EDA领域基于业务的监控功能,敬请期待哦~

你看,不仅可以自动化跑任务,还能时刻帮你盯着任务是否出错。

来,我们小暴力一下

先说结论:

我们在单台大机器多台小机器组合场景下分别跑了同一组Calibre任务。

单台大机器场景下,随着核数的增加,任务耗时呈现明显的线性下降关系,整体性能曲线非常贴近基准线(单机核数有上限,本次实证中,我们使用的最大单机为128核,并根据32核、64核、128核的耗时规律预估了256核单机的耗时数据,仅供参考)。

多台小机器组合场景下,随着机器数量的翻倍,任务耗时同样线性下降,但在后期倍数关系上有所损耗,多机性能曲线略低于基准线和单机性能曲线。

实证过程:

1、使用fastone云平台调度32核、64核、128核单机分别运行一组Calibre任务,耗时分别为14小时57分49秒、7小时30分28秒、3小时50分11秒;

2、按上条实证数据,预估使用fastone云平台调度256核单机运行一组Calibre任务的耗时为1小时58分6秒;

3、使用fastone云平台调度2、4、8台32核机器分别运行一组Calibre任务,耗时分别7小时43分51秒、4小时6分14秒、2小时15分34秒。

还有大家关心的Intel第四代机器,我们也搞来跑了一下

在上一节中,我们使用的均为第三代英特尔至强可扩展处理器,而在2023年1月11日,英特尔正式推出了第四代至强可扩展处理器。

我们立马搞来跑了一遍,为了对比参照,我们还拉上了第二代和第三代,并且把核数都按比例换算为48核。

实证过程:

1、使用fastone云平台调度48核第二代英特尔处理器运行一组Calibre任务,耗时10小时46分26秒;

2、使用fastone云平台调度48核第三代英特尔处理器运行一组Calibre任务,耗时9小时56分13秒,相比第二代提升7.77%;

3、使用fastone云平台调度48核第四代英特尔处理器运行一组Calibre任务,耗时8小时18分43秒,相比第三代提升16.35%,比第二代提升22.85%。

可以看到每一代都有提升,且型号越新,提升幅度越大,三代比二代提升了7.77%,四代比三代提升了16.35%。

而在价格上,目前四代和三代的类似机型换算一下,几乎是相同的。

实证小结

1、Calibre DRC/LVS/PEX不刚需高主频机型,但要求多核、大内存的机器,任务可拆分,适合暴力堆机器;

2、fastone云平台的全球动态资源池、集群自动化管理能力、自动化跑任务并监控告警的功能可完美匹配Calibre的需求;

3、随着计算资源的提升,Calibre的任务耗时呈现明显的线性关系,其中单机整体性能曲线非常贴近基准线,多机效果后期会略有折损;

4、最新型号的处理器可以大幅提升Calibre的效率,可根据项目周期与实际预算综合考量机型配置。

本次EDA云实证系列Vol.13就到这里了。

下一期,我们聊ADS,也可能是ALPS。看心情~~~

关于fastone云平台在各种EDA应用上的表现,可以点击以下应用名称查看:

HSPICE│ OPC │ VCS │ Virtuoso

速石科技芯片设计五部曲,前三部先睹为快:

模拟IC│数字IC│算法仿真

- END -

我们有个IC设计研发云平台

IC设计全生命周期一站式覆盖

调度器Fsched国产化替代、专业IT-CAD服务

100+行业客户落地实践

支持海内外多地协同研发与办公

多层安全框架层层保障

现在免费试用,送300元体验金,入股不亏~

更多EDA电子书欢迎关注小F(ID:iamfastone)获取

你也许想了解具体的落地场景:

王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接

这样跑COMSOL,是不是就可以发Nature了

Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

1分钟告诉你用MOE模拟200000个分子要花多少钱

LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置

揭秘20000个VCS任务背后的“搬桌子”系列故事

155个GPU!多云场景下的Amber自由能计算

怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

大规模OPC上云,5000核并行,效率提升53倍

提速2920倍!用AutoDock Vina对接2800万个分子

从4天到1.75小时,如何让Bladed仿真效率提升55倍?

从30天到17小时,如何让HSPICE仿真效率提升42倍?

关于为应用定义的云平台:

最强省钱攻略——IC设计公司老板必读

芯片设计五部曲之三 | 战略规划家——算法仿真

芯片设计五部曲之二 | 图灵艺术家——数字IC

芯片设计五部曲之一 | 声光魔法师——模拟IC

【案例】速石X腾讯云X燧原:芯片设计“存算分离”混合云实践

【ICCAD2022】首次公开亮相!国产调度器Fsched,半导体生态1.0,上百家行业用户最佳实践

解密一颗芯片设计的全生命周期算力需求

居家办公=停工?nonono,移动式EDA芯片设计,带你效率起飞

缺人!缺钱!赶时间!初创IC设计公司如何“绝地求生”?

续集来了:上回那个“吃鸡”成功的IC人后来发生了什么?

一次搞懂速石科技三大产品:FCC、FCC-E、FCP

速石科技成三星Foundry国内首家SAFE™云合作伙伴

EDA云平台49问

亿万打工人的梦:16万个CPU随你用

帮助CXO解惑上云成本的迷思,看这篇就够了

花费4小时5500美元,速石科技跻身全球超算TOP500

速石科技(ID:Fastone_tech)

我们致力于构建为应用定义的云,让任何应用程序,始终以自动化、更优化和可扩展的方式,在任何基础架构上运行。希望和你共同建立持续迭代的多云世界观。

说出你的应用,我们就有故事~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/696425.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3.5.1MapReduce原理详解

单机程序计算流程 输入数据—>读取数据—>处理数据—>写入数据—>输出数据 Hadoop计算流程 input data:输入数据 InputFormat:对数据进行切分,格式化处理 map:将前面切分的数据做map处理(将数据进行分类&#xf…

怎么写一份好的接口文档?

目录 前言: 接口文档结构 参数说明 示例 错误码说明 语言基调通俗易懂 及时更新与维护 总结 前言: 写一份好的接口文档有助于开发者理解和使用你的API。, 编写一份优秀的接口文档会让软件开发中变得更加轻松,更有效率。…

一个大于6的偶数,能被两个质数相加得到

一个大于6的偶数,能被两个质数相加得到 1.描述 证明:一个大于6的偶数,能被两个质数相加得到 2.代码 先判断输入的数据是不是大于6的偶数 编写判断某个数是不是质数的方法 从中间两侧把数相加看看能不能得到对应的偶数两个奇数相加能够得到的值 public class Main…

linux入门之进程概念上(冯诺依曼系统,系统概念与定位,PCB,fork初识)

文章目录 目录 一、认识冯诺依曼系统 二、操作系统 1.概念 2.设计os的目的 3.定位 4.如何理解管理 三、系统调用和库函数 四、进程 1.基本概念 2.描述进程-PCB 3.组织进程 4.查看进程 5.通过系统调用获取进程标识符 6.通过系统调用创建进程-fork初识 6.1fork原理…

Spring(9) IOC容器中的单例Bean的线程安全问题

目录 1.知识点回顾2.线程安全3.总结 1.知识点回顾 在 Spring 中我们可以通过 Scope 注解来指定 Bean 的创建方式。 Servcie Scope("singleton") public class UserServiceImpl implements UserService {}Scope 注解的值有两种: singleton:B…

vue3使用高德地图实现点击获取经纬度

话不多说直接上干活 在此之前你需要有高德地图的 key&#xff0c;这个自己去申请即可 1&#xff0c;首先需要在终端安装 npm i amap/amap-jsapi-loader --save 2&#xff0c;准备一个容器 <template><div id"container"></div> </templat…

Redis+Lua脚本解决高并发情况下库存超卖的问题

文章目录 一、实现思路二、实现代码 一、实现思路 二、实现代码 order.lua脚本代码&#xff1a; -- 参数列表 local productIdStr ARGV[1] local productNameStr ARGV[2] local cartQuantityStr ARGV[3] local orderId ARGV[4] local userId ARGV[5] local orderDate A…

Android 控件颜色与实际不符「解决方案」

问题复现 背景色设置为 绿色&#xff0c;然而 Button 控件却显示 紫色 解决方案 这是由于 Theme 修改导致&#xff0c;只需要修改配置文件 themes.xml 中 parent 属性 即可 如果找不到该文件&#xff0c;先将工程结构展示改为 Project 即可 原配置&#xff1a; <style nam…

【网络智能化】网络杂谈(9)之如何做到网络管理智能化

涉及知识点 什么是网络管理智能化&#xff0c;基于专家系统的网络管理&#xff0c;基于智能 Agent 的网络管理&#xff0c;基于计算智能的宽带网络管理&#xff0c;深入了解网络管理智能化技术。 原创于&#xff1a;CSDN博主-《拄杖盲学轻声码》&#xff0c;更多内容可去其主页…

软件业务连续性管理的意义是什么?

软件业务连续性管理是指在软件开发和运营过程中&#xff0c;确保业务能够持续进行的管理方法和实践&#xff0c;它是一种综合性的管理方法&#xff0c;旨在确保在软件系统出现故障、灾难或其他不可预测的情况时&#xff0c;能够快速、有效地恢复业务&#xff0c;以最大程度地减…

【数据分享】全国县市2000-2021年教育、卫生和社会保障数据(excel\shp格式)

《中国县域统计年鉴》是一部全面反映我国县域社会经济发展状况的资料性年鉴&#xff0c;收录了上一年度全国2000多个县域单位的基本情况、综合经济、农业、工业、教育、卫生、社会保障等方面的资料。 之前基于《中国县域统计年鉴》我们分享了2000至2021年的综合经济数据和农业…

gitee删除已上传的废弃工程

第一步:打开Git Bash或者右击电脑桌面打开也可以做到 第二步:cd到指定的工程文件夹内 dir 看一下&#xff0c;下面的项目是否正确 第三步:输入命令 git rm -r 想要删除的项目名称 第四步&#xff1a;输入命令 git commit -m 备注 第五步&#xff1a;输入命令保存 git pu…

Day.1 LeetCode刷题练习(最长公共前缀 C/C++两种解法)

题目&#xff1a; 例子&#xff1a; 分析题目&#xff1a; 主要目的&#xff1a;求出各个字符串的公共前缀 思路&#xff08;本人解法&#xff09;&#xff1a; 用所给实例来看&#xff0c;不难看出我们可以直接以竖着对应来查看是否是公共前缀 &#xff0c; 这样就有了一…

android的PopupWindow透明弹窗

1.要实现这种效果 2.可以使用这种方式 View v LayoutInflater.from(mContext).inflate(R.layout.ceshi_01, null);PopupWindow popupWindow new PopupWindow(v, ViewGroup.LayoutParams.MATCH_PARENT, ViewGroup.LayoutParams.MATCH_PARENT, true);popupWindow.showAsDropDo…

云原生(第一篇)k8s-组件说明

k8s是什么&#xff1f; go语言开发的开源的跨主机的容器编排工具&#xff1b;全称是kubernetes&#xff1b; k8s的组件&#xff1a; master&#xff1a; ①kube-apiserver 所有服务统一的访问入口&#xff0c;无论对内还是对外&#xff1b; ②kube-controller-manager 资源控…

java8新特性---lambda表达式

1、 Lambda是什么&#xff1f; Lambda 是一个匿名函数&#xff0c;我们可以把 Lambda表达式理解为是一段可以传递的代码&#xff08;将代码像数据一样进行传递&#xff09;。可以写出更简洁、更灵活的代码。作为一种更紧凑的代码风格&#xff0c;使Java的语言表达能力得到了提…

linux配置git账号密码

HTTP/HTTPS Linux 在Linux环境下使用http/https协议clone/pull GitLab仓库的代码遇到这个问题。以下解决方案也适合GitHub或其他仓库如码云&#xff0c;coding。 解决方案&#xff1a; 在home目录下创建.git-credentials文件vim .git-credentials&#xff0c;输入形如https:…

重装pycharm后一直在Updating indexes

今天卸载pycharm社区版&#xff0c;安装好pycharm专业版之后&#xff0c;右下角一直显示Updating indexes 解决步骤&#xff1a; 先卸载pycharm&#xff1b;打开cmd&#xff0c;键入regedit&#xff0c;打开“注册表编辑器”&#xff1b;在“注册表编辑器”中按ctrlF&#xff…

spring是如何解析@Transactional属性的

1、查看value调用 发现并无地方调用 2、查看 transactionManager调用 发现并无地方调用 3、直接查看transaction被解析方法 SpringTransactionAnnotationParser#parseTransactionAnnotation(java.lang.reflect.AnnotatedElement) 4、查看返回的解析类 Tra…

C++——二分法求多项式曲线区间极值

二分法求多项式曲线区间极值 二分法求解&#xff0c;设置left为左边界&#xff0c;right为右边界&#xff0c;则解一定位于left和right之间&#xff0c;当左右边界之间的差值小于某一精确度时&#xff0c;就认为找到了解。具体操作如下&#xff0c;若是先减后增&#xff0c;首先…