跳转至主要内容

ANSYS的博客

2022年5月11日

为Ansys Fluent释放gpu的全部功能,第1部分

你下班回家的路上,从纽约到伦敦的航班,办公室里的旧咖啡机,你的公司仍然不升级……就像计算流体动力学(CFD)模拟一样,所有这些都将受益于加速。

多年来,加速CFD模拟的关键推动者之一是高性能计算(HPC),近年来已扩展到图形处理单元(gpu)。

在CFD领域利用gpu并不是一个新概念。gpu被用作CFD加速器已经有很长一段时间了(包括在Ansys流利自2014年以来)。然而,你得到的局部加速度是依赖于问题的。最后,未针对gpu进行优化的代码部分将限制你的整体加速。这就是为什么我们想向您展示当CFD模拟在多个gpu上本机运行时,gpu所具有的潜力。

这是我们的博客系列“为Ansys Fluent释放gpu的全部功能”的第一部分,该系列将演示gpu如何帮助减少模拟时间、硬件成本和功耗。在第一期中,我们将介绍一些层流和湍流问题。随着本系列的深入,将讨论物理建模功能。

32X加速汽车外部空气动力学

对于我们的第一个例子,让我们看看汽车外部空气动力学模拟,它可以很快变得非常大-通常超过3亿个单元。运行这种规模的模拟将需要数千个内核和数天(有时甚至数周)的计算时间。如果有一种方法可以将模拟时间从几周缩短到几天,或者从几天缩短到几个小时,同时还能显著降低功耗呢?剧透警告:确实有,那就是完全在gpu上运行这些模拟。

可持续性是汽车行业的一个关键问题,世界各地的政府机构都在制定严格的法规。汽车公司一直在评估以满足或超过这些法规的一些领域包括:

  • 改善空气动力学
  • 减少排放
  • 使用替代燃料
  • 开发混合动力和电动动力系统

但可持续发展的努力不应该局限于最终产品(在这种情况下是一辆汽车)的操作,这种努力也应该延伸到产品的设计过程。这包括模拟,而Ansys希望降低模拟过程中的功耗。

汽车外部空气动力学模拟可以通过完全运行在图形处理器上来加速

汽车外部空气动力学模拟可以通过完全运行在图形处理器上来加速

对于所显示的仿真,我们使用Fluent在不同的CPU和GPU配置上运行基准DrivAer模型,并比较性能。我们的结果显示,单个NVIDIA A100 GPU的性能比拥有80个Intel®Xeon®白金8380内核的集群高出5倍以上。当扩展到8个NVIDIA A100 gpu时,模拟速度可提高30倍以上。

利用gpu加速汽车外部空气动力学模拟

利用gpu加速汽车外部空气动力学模拟

在更短的时间内获得结果使我们的客户更有效率,但这还不止于此:我们还可以通过大幅减少运行此类模拟所需的电力来减少他们的电费(并帮助地球!)。

我们查看了拥有1024个Intel®Xeon®Gold 6242核的CPU集群的功耗,并注意到功耗为9600 W。与具有相同性能的6 x NVIDIA®V100 GPU服务器的功耗相比,功耗降低了四倍,降至2400 W。

这些基准测试结果表明,与同等的HPC集群相比,选择6倍NVIDIA®V100 GPU服务器的公司可以将其功耗降低4倍,这甚至还没有考虑为保持服务器机房凉爽而降低的冷却成本。

降低GPU服务器的功耗

降低GPU服务器的功耗

在原生GPU求解器上运行模拟可以产生巨大而直接的影响,既可以促进公司的可持续发展,也可以减少等待结果的时间。不是随便的结果——这些是你可以信任的结果。在过去的40多年里,Fluent已经在广泛的应用程序中得到了广泛的验证,并以其行业领先的准确性而闻名。在Fluent中可用的CPU和多gpu求解器都建立在相同的离散化和数值方法上,为用户提供几乎相同的解决方案结果

下面的两个典型案例是经过验证的CFD验证,它们模拟了层流和湍流区的基本情况。这两种情况都详细说明了用户在gpu上本机求解时将获得的精度。

球面上的层流

文献丰富的实验和数值研究的流动在一个球体,作为一个基本基准的外部空气动力学验证。在第一次测试中,我们选择了层流条件雷诺数等于100,流体会绕着球体旋转在圆柱体后面形成定常的涡流结构。利用文献中提出的阻力相关性来比较CFD结果与实验数据。

层流在球面基准上的速度流线和压力分布

层流在球面基准上的速度流线和压力分布

如表1所示,原生GPU实现计算阻力系数非常准确,误差率仅为-0.252%。

阻力系数(Cd)比较

表1。阻力系数(Cd)比较

向后朝步

后向步骤是用于测试湍流模型实现的典型问题。看似简单的结构却蕴含着丰富的物理意义。为了这个测试,我们重新创建了沃格尔和伊顿建立的实验2进气道速度为2.3176 m/s。通过将沿通道长度的不同平面上的速度分布与已公布的实验数据进行比较,对CFD代码进行了测试。

向后阶跃的速度向量

向后阶跃的速度向量

当在cpu上求解时,Fluent显示良好的有效性附有实验结果3、4.用本地的多GPU求解器来解决同样的问题,为用户提供了几乎相同的结果,如下所示,因为在Fluent中可用的CPU和GPU求解器都是建立在相同的离散化和数值方法上的。

当在cpu和gpu上求解时,后向步骤的速度剖面结果

当在cpu和gpu上求解时,后向步骤的速度剖面结果

这种原生的多gpu实现的非结构化,有限体积的纳维-斯托克斯求解器,接受所有网格类型是真正新颖的,并设置了一个新的CFD标准,不妥协准确性。对利用gpu解决问题所带来的巨大加速感兴趣吗?联系我们现在。


参考文献

  1. Turton r;和Levenspiel, O.,关于球体的阻力相关性的简短说明,粉末技术。, 47, 83-86, 1986
  2. Vogel j.c., and Eaton, j.k .(1985)结合了一个朝后台阶下游的传热和流体动力学测量。J.热传导107,922-929。
  3. 斯米尔诺夫,叶夫盖尼和斯米尔诺夫斯基,亚历山大和舒尔,尼古拉和扎伊采夫,德米特里和斯米尔诺夫,P.(2018)。RANS和IDDES解决方案的湍流流动和传热过去一个后向步骤的比较。热与传质,54。10.1007 / s00231 - 017 - 2207 - 0
  4. 巴奈特·H.,拜斯·A.,孔德卡·K.,乔杜里·R., Bhambere M.B.(2020)。基于CFD的改进后向台阶流体流动数值模拟。国际工程技术研究杂志。第七卷,第九期

Erfahren Sie, wie Ansys Ihnen helfen kann

KONTAKT

* =普弗利特菲尔德

Danke für die Kontaktaufnahme

我们在这里回答你的问题,期待与你交谈。我们Ansys销售团队的一名成员将很快与您联系。

傅ßzeilenbild