由于操作过于频繁,请点击下方按钮进行验证!

设计仿真 | MSC Nastran高性能求解计算(二)

国际金属加工网 2025年01月06日

MSC Nastran是一款功能强大的有限元分析(FEA)软件,是工程仿真的基础。MSC Nastran已经被结构分析专家使用和验证了半个世纪,以其稳健性、准确性和能够解决工程中的挑战而闻名。

本期摘要内容

• 了解MSC Nastran如何利用高性能计算(HPC)策略提高您的仿真和分析性能。

• 探索适用于所有分析类型(包括静力学、特征值、动力学和非线性)的可用求解器,以便您可以根据特定的仿真需求选择最合适的求解器。

• 从其他MSC Nastran用户和Hexagon专家的经验中汲取见解,以实现最佳的并行性能,同时最大限度地降低读取和写入磁盘的成本。

• 将HPC专业知识与对MSC Nastran求解器的全面了解相结合,以显著加快仿真速度、最大限度地降低成本并提高不同类型分析的效率。

点击MSC Nastran高性能求解计算(一),查看首期内容,有关 MSC Nastran 中高性能计算选项的更多详细信息,请参阅MSC Nastran 2024.1 HPC用户指南。

01  并行设置  

如今,几乎每台计算机中的中央处理器(CPU)在物理CPU芯片上都有多个内核。每个物理芯片都称为一个插槽。根据体系结构的不同,计算机可能配备多个CPU芯片(每个芯片都有自己的插槽),并且每个CPU可能包含多个内核。如果编写软件是为了利用多个内核,那么软件通过并行使用这些内核来提高解决给定问题的速度,称为可扩展性。

可扩展性对于求解器来说至关重要,因为它确保了处理规模越来越大、越来越复杂问题的能力,在不影响性能或效率的情况下满足不断增长的需求。在MSC Nastran中,有两种不同但互补的并行处理方式:

•共享内存并行(SMP)

•分布式内存并行(DMP

两者之间的区别在图4中得到了最好的说明。共享内存并行(SMP)系统具有多个处理器共享单个公共内存空间和I/O系统,允许直接通信和数据共享。相比之下,分布式内存并行(DMP)系统为每个处理器分配自己的内存和I/O系统,因此需要显式消息传递才能进行处理器间的通信。SMP架构非常适合多核CPU上的多线程应用程序,而DMP架构在集群等大规模并行计算环境中很常见。

微信图片_20250106090902.jpg

图4:SMP和DMP之间的区别

例如,通常使用SMP和DMP的组合来提高特征值分析问题的求解效率。一般建议将DMP设置为插槽数(如果本机中有多个插槽),并将SMP设置为每个插槽的内核数。如果在具有两个CPU(插槽)的系统上运行,每个 CPU(插槽)上有10个内核,可以设置dmp=2和smp=10。不同的SMP和DMP组合性能因要解决的具体问题和所使用的模型而异。

02  硬件配置  

Part.01

磁  盘

现代操作系统在避免不必要的物理I/O运算方面做得很好,即需要写入或读取某些永久存储设备(如硬盘(HDD 磁性存储)、固态磁盘(SSD) 或非易失性存储器(NVMe)的操作。然而,它们执行此操作的能力是有限的,主要由系统中安装的可用于缓冲I/O(即当前正在运行的进程未占用的内存)内存(RAM)控制。大多数软件都依赖于操作系统I/O缓冲区来高效工作,但一些软件(包括 MSC Nastran)实现了自己的缓冲I/O逻辑,尽管这也存在限制。鉴于当前有限元模型的规模,超过系统I/O缓冲大小的问题是很常见的。计算机的I/O系统的速度自然会对性能产生影响,任何可以提高性能的事情都减少计算时间。

Part.02

建议和准则

▶避免使用网络、网络连接存储(NAS)或通用串行总线(USB)驱动器。

▶SSD(最好是NVMe存储设备)提供比传统HDD更高的I/O缓存速率,强烈建议用于存储临时数据的文件系统(也就是临时目录)。

▶如果使用HDD进行临时文件存储,磁盘的转速(范围为7000至15000 RPM)可能会产生影响;磁盘速度越快,性能越好。

▶如果不需要保存数据库,请使用命令行选项 SCR=YES运行MSC Nastran。使用SCR=YES时,一些临时数据在使用后会被删除,而不是移动到数据库文件中 。

▶强烈建议对临时文件系统(RAID-0)使用设备条带化。可以在设备上配置多个媒体存储单元(HDD、SSD 或NVMe),以便同时进行I/O操作,为I/O速度提供了线性缩放。Windows和Linux系统都可以在O/S级别创建RAID-0 条带化文件系统(不需要特殊控制器)。将设备I/O传送到内存的管道(称为前端总线或FSB)对这种缩放施加了限制。其他级别的RAID(例如RAID-5)具有专门构建的冗余,临时数据不需要冗余,并且可能导致性能下降。

▶在Linux 系统上,使用XFS文件系统作为临时文件系统;临时数据不需要日志文件系统。

▶如果您的预算有限,最好(也更便宜)将4个HDD设备条带化为RAID-0 而不是单个NVMe。

注意:所有SSD/NVMe都不相同。选择临时存储时,请检查设备的读取和写入速度。在一次写入、读取多个系统时,读取性能比写入更重要,但对于MSC Nastran来说,两者都需要快速才能达到最佳性能。

图5显示了MSC Nastran 在两个作业中比较SSD和HDD(SCSI)介质的性能:

微信图片_20250106090906.jpg

图 5:两种型号的硬盘驱动器(HDD)与固态驱动器(SSD)磁盘的比较

Part.03

CPUs

很难就哪个处理器是“最佳”的选项给出具体建议,但一些指南可以帮助您做出决定。通常,CPU类型和功能的数量会受到其他硬件选择的限制,例如主板的架构,它为CPU强加了插槽配置。

在考虑性能时,计算机系统中没有一个特定的项目可以作为目标——它是一个整体。拥有极快的CPU几乎没有意义,如果I/O系统将导致瓶颈并增加运行时间,求解阶段将从中受益。同样,如果CPU速度慢或系统内存不足,则使用极快的I/O系统是没有意义的。最好以一个能够很好地协调工作的系统为目标。这通常意味着您不需要最新一代和最强大的CPU,可以选择已有一两年历史的型号。例如,随着新型号和技术的不断涌现,被取代的CPU型号的成本在推出后迅速下降,您在这里节省的预算可用于为条带化I/O系统投资更多内存或更多设备。

在选择CPU时,寻找比较所有供应商不同处理器之间CPU速度的基准测试网站。基准测试的范围往往很广,涉及CPU技术的不同方面,因此,如果处理器在执行整数运算方面速度很快,但在浮点运算方面不太擅长,反之亦然,这些特征就会在结果中显现出来。

随着当前对环保硬件的推动,CPU芯片通常采用所谓的效率模式(使用E核)或性能模式(使用P核)。虽然这对于运行数据库应用程序的计算机来说可能非常有用,因为CPU不经常被请求,或者对于一个移动设备电池消耗可能是个问题,但对于插入主电源的计算服务器系统,效率模式会妨碍性能。确保您选择的CPU能够禁用效率模式,或者至少强制始终性能模式。

如今,大多数CPU都支持超线程,虽然超线程对于某些倾向于交互式且持续时间较短的应用程序很有用,但在考虑MSC Nastran计算时,经验表明,禁用超线程会有助于提高性能。您将知道系统上是否启用了超线程,因为逻辑CPU的数量将使整个CPU插槽的内核数量增加一倍;超线程使CPU看起来拥有比实际更多的内核。

每一代新一代CPU 都带来了新的逻辑来加速运算,例如通过巧妙地访问CPU中的寄存器来聚合操作,或者流水线,以便在单个CPU时钟周期内实现多个运算。过去,我们看到了流式SIMD扩展SSE、SSE2、SSE3、SSE4 和高级矢量扩展AVX(Gesher 新指令)、AVX2(Haswell 新指令)、AVX-512、AVX10 和最近的高级性能扩展APX。

最重要的一点是,MSC Nastran的开发努力支持最新的编译器和供应商库,而这些编译器和供应商库又支持最新的扩展,因此,一般来说,如果您的系统上有可用的功能,它们将被使用。如果没有这些功能,也不影响使用。这种兼容性和定期引入新功能是采用最新版本的MSC Nastran软件的充分理由。

  

微信图片_20240419160555.jpg   

  

(海克斯康工业软件)

声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容,以保证您的权益!联系电话:010-58612588 或 Email:editor@mmsonline.com.cn。

网友评论 匿名:
相关链接
  • 设计仿真 | 基于Adams与Odyssee机器学习的超跑变速箱机构优化方案
  • 25-01-06
  • 设计仿真 | Digimat在NVH和热冲击的应用
  • 25-01-06
  • 生产制造 | NCSIMUL模型比较——为安全高效生产保驾护航
  • 25-01-06
  • 质量管理 | 海克斯康数字化管理平台助力传动机械行业质量管理效率提升
  • 25-01-06
  • 设计仿真 | 海克斯康 MSC Nastran 助力沃尔沃重型卡车实现最佳 NVH 性能
  • 24-12-30
  • 设计仿真 | Digimat用于碰撞、冲击模拟热塑性塑料材料解决方案
  • 24-12-30
  • 设计仿真 | Adams_Controls变拓扑分析
  • 24-12-30
  • 生产制造 | 产品加工-EDGECAM 高效自动编程-自定义半自动编程篇
  • 24-12-30
  • 质量管理 | 海克斯康质量管理平台数字化纠正预防措施
  • 24-12-30
  • 设计仿真 | MSC Nastran高性能求解计算(一)
  • 24-12-23
  • 设计仿真 | 新版本Dytran 用户子程序调用及案例分享
  • 24-12-23
  • 设计仿真 | Marc流体压力密封渗透功能
  • 24-12-23
  • 生产制造 | ESPRIT EDGE灵活创建3D刀柄刀座文件
  • 24-12-23
  • 质量管理 | 海克斯康数字化质量平台的变更管理解决方案
  • 24-12-23
  • 设计仿真 | 海克斯康VTD智能驾驶仿真方案—Camera
  • 24-12-16
  • 设计仿真 | Adams-Marc联合仿真帮助客户准确模拟车门关闭过程
  • 24-12-16
  • 设计仿真 | 使用人工智能方法扩充Sabic材料数据
  • 24-12-16
  • 生产制造 | SMIRT自动优化DieNC 铣床页面路径中的共线点
  • 24-12-16
  • 质量管理 | 海克斯康 Q-DAS赋能电子行业数字化质量管理
  • 24-12-16
  • 分享到

    相关主题