跳转至主要内容

Ansys优势杂志

日期:2019年

可扩展的方法来解决日益增加的芯片复杂性

作者:以色列Mellanox Technologies后端设计总监Anton Rozen


不断增加的设计复杂性和多物理场挑战阻碍了片上系统(SoC)设计团队的生产力。Mellanox工程师应用新的解决方案,利用大数据技术和灵活的计算资源,提供电子设计自动化功能。

不断增加的设计复杂性和多物理场挑战阻碍了片上系统(SoC)设计团队的生产力。工程师们希望电子设计自动化工具不仅能减少运行时间,还能提高他们严格检查和改进设计的灵活性。Mellanox工程师采用新的解决方案,利用大数据技术和灵活的计算资源来实现这一功能。

高速网络是数据中心连接的基础。超高带宽和超低延迟网络解决方案对于数据中心下一个时代的高效处理来自新兴AI、5G和自主应用的指数级增长数据至关重要。由于芯片尺寸和复杂性与不断增加的上市时间压力相冲突,为网络进行片上系统(SoC)设计的公司面临着挑战。网格的复杂性和栅极的数量每年都在急剧增加,网络IC团队必须设计、分析和制作尺寸为400-500毫米或更大的芯片。


随着Mellanox将设计推向超深亚微米节点,设计的复杂性——以及对更灵活和可扩展的设计工具解决方案的需求——已经增加。


各种多物理场效应(包括功率和热可靠性)的交叉耦合增加,对FinFET的设计闭合提出了重大挑战。多物理场分析对于克服这些挑战至关重要,以便设计出超大、复杂和耗电的芯片,尽管设计边界越来越窄,项目进度越来越紧。

面对这种复杂性,设计团队必须拥有能够提供容量、灵活性、速度和准确性的软件工具。

Mellanox是为服务器、存储和超融合基础设施提供端到端以太网和InfiniBand智能互连解决方案和服务的领先供应商,了解这些挑战和权衡。设计团队必须通过最有效地利用计算资源和工程时间来管理和验证设计。为此,该团队依靠Ansys RedHawk-SC软件。


寻找能见度

Mellanox团队需要具有精确压降精度的快速周转时间,以确保其高度复杂的网络处理器的电源完整性和可靠性。但他们也在寻求早年在其他大型、高复杂性设计中未能实现的东西:灵活性和分析速度。由于设计已经从45纳米节点的1亿多网发展到16纳米节点的近3.5亿网,Mellanox估计它将需要解决近4.5亿7纳米的IC网。

可伸缩性比较:软件的发展如何大幅减少日益复杂的soc的运行时间


这种类型的进化需要工具能力来匹配。十年前,在45nm工艺节点及其周边,工具架构通常是单片的,团队被限制在一台机器上,可以同时处理多达10亿个电源和地面节点。(节点是被提取的电源和接地网络中任意两个元素之间的连接点。这些元件可以是导线的寄生电阻、电感或电容,也可以是连接导线的器件实例引脚。节点数是功率完整性分析中常用的预测设计尺寸的指标;它直接影响分析的运行时间和内存需求。)

在当时,工具容量是个问题。当对电源完整性和可靠性签到进行多次分析时,每次运行(串行而不是并行)可能需要超过24小时。这需要大型服务器和相当大的资源分配来完成分析。更糟糕的是,系统偶尔会在管理复杂性方面遇到困难,并会崩溃。然后分析将不得不从头开始。

第二代人出现了,以跟上复杂性。这一代利用分布式计算,最多可以扩展到32台机器,最多可以处理40亿个节点。这是令人满意的,直到集成电路变得更加复杂。


适应大数据需求

为了提供洞察并使团队能够优化设计,Mellanox需要一个灵活的、高容量的解决方案,可以扩展到大数据挖掘和分析。工程师们从2018年开始使用Ansys RedHawk-SC。RedHawk-SC是基于Ansys SeaScape构建的最新SoC电源完整性和可靠性签到平台,Ansys SeaScape是全球首个为电子系统设计和仿真定制的大数据架构。海景提供了每核可扩展性,灵活的设计数据访问,瞬时设计带来
以及许多其他功能。

Ansys SeaScape大数据弹性计算架构



成功的关键之一在于红鹰- sc的弹性计算能力。弹性计算有助于并行(或串行)处理场景,具体取决于可用的CPU核数。

海景架构是弹性计算的核心。它依赖于分布式数据/文件服务,因为数据可能分散在许多位置。在此之上是基于MapReduce概念的分布式数据分析层,这是所有大数据分析的基础。这在概念上将数据(映射)分割为称为碎片的小块,并将每个碎片集中用于分析。可以在服务器可用时将处理分发到服务器,并根据需要跨多个服务器进行处理。


电力问题

这些类型的网络处理器面临的挑战是总功耗和功耗。与电池供电的设计不同,Mellanox使用的设计类型可以消耗超过200w。因此,工程师必须实现完整的设计分析-精确的增量功率完整性和可靠性分析-同时考虑高功耗,而不牺牲精度或结果时间。

为了加快全芯片红外跌落仿真,可以利用电网滚动方法提取电力和地网的中低能级金属。这种抽象可用于全芯片仿真。这使得团队可以在单元级工作,然后跳转到顶层,对全芯片设计进行全面分析

使用Ansys RedHawk-SC rollup方法进行电力完整性仿真的一个例子,用于提取电网的低和中层金属层,以进行快速增量全芯片分析。


进行全芯片平跑是一项资源密集型且耗时的工作。通过使用大数据分析技术实现增量分析,设计师可以创建特定块的详细视图,并抽象其他所有内容。这使他们能够执行更快的分析,并通过可见性更容易地进行更快的工程变更命令(ECO)修复。

Ansys RedHawk-SC凭借其弹性计算能力和大数据分析,为工程师提供了克服之前一些挑战所需的可见性。团队特别欣赏RedHawk-SC的自我维持稳定性,可以监控自己的作业,并在作业失败时更新作业。

该团队还利用RedHawk-SC的弹性计算和mapreduce支持的分析来获得关键的见解。MapReduce为设计师提供了一个鸟瞰的视角,并非常顺利地锁定热点。它提供了强大的功能,例如在不到两分钟的时间内打开GUI查看完整的芯片数据库,并轻松导航不同的区域,如谷歌Maps的功能。

此外,它还支持更强大的计算灵活性。凭借红鹰- sc的弹性可扩展性,曾经需要巨大计算资源的大型芯片区域可以被分解成非常小的块进行分析。架构的性质允许这些元素通过公司的计算资源进行分布。这样可以最大限度地利用硬件资源,优化成本。


静态电压比较的散点图

看看Ansys可以为您做什么

今天就联系我们

* =必填项

谢谢你的联系!

我们在这里回答你的问题,期待与你交谈。我们Ansys销售团队的一名成员将很快与您联系。

页脚的形象