Pera.Grid高性能计算与调度平台

概述

随着非线性技术、多物理场耦合仿真、多学科优化技术等复杂工程仿真技术在研发过程中的成熟和深入应用,越来越多现代企业选择使用基于Linux HPC集群来实现复杂仿真运算,而从Windows单机到Linux集群的跨越却对研发软件和硬件资源的有效组织和高效利用提出严峻挑战。安世亚太高性能计算平台PERA.GRID,正是解决软硬件使用效率的有效工具。

PERA. GRID是一个稳定可靠的license排队、硬件负载均衡以及作业调度系统。通过本系统,仿真用户可以轻松地进行CAE作业提交和管理,而无须任何命令行操作,进而有效管理license资源池、硬件计算资源池、已经正在进行的作业和正在排队的作业,以及这些作业正在使用的license资源和硬件资源等。便捷易用的PERA.GRID是提升企业研发工具软件和硬件设备使用效率的必备工具,更是应用ANSYS系列等CAE软件大规模仿真的最佳伴侣。同时能够很好地整合其它非ANSYS的CAE产品,如Nastran,Abaqus,StartCD,phoenics,matlab等软件,构建成一个面向CAE的HPC计算平台。 

PERA.GRID主要由三部分组成:客户端(运行在工作站上),调度引擎和WEB门户。用户可以通过客户端或WEB门户将作业提交到调度引擎上,通过调度引擎进行作业的整体调度和作业的启动,状态监控和停止。管理员可以通过WEB门户对用户和作业进行管理。 


深度整合ANSYS系列产品

ANSYS Fluent Jou文件生成器;

支持ANSYS Mechanial胖节点单机排队

支持主进程固定分配在胖节点上,支持超大规模隐式求解器的运行

支持ANSYS CFX续算

支持ANSYS Fluent UDF高效智能的License调度功能:

  • 支持流行CAE软件的License使用方式,尤其是ANSYS系列软件
  • 基于模板的作业提交方式,易于扩展,支持自研软件集成
  • 方便的用户管理以及求解器和并行量的分配机制

功能特色

深度整合ANSYS系列产品

  • Fluent Jou文件生成器
  • 支持Mechanial胖节点单机排队
  • 支持主进程固定分配在胖节点上,支持超大规模隐式求解器的运行
  • 兼容Workbench作业在PERA.GRID集群队列中运行
  • 支持CFX续算
  • 支持Fluent UDF
支持Abaqus,Nastran,StarCD,Phoenics,lstc-dyna,matlab等主流CAE产品的并行计算

高效智能的License调度功能

  • 支持流行CAE软件的License使用方式,尤其是ANSYS系列软件

大文件上传下载的一站式解决方案

一键提交批量CAE作业,可用于优化和参数研究

B/S C/S双系统结合,满足不同使用场景

基于模板的作业提交方式,易于扩展,支持自研软件集成

方便的用户管理以及求解器和并行量的分配机制

相关模块

资源监控

资源监控模块是PERA.GRID的资源状态展示模块,是为用户提供可查看和了解现有计算系统状态的窗口。功能清晰,界面简单,可以帮助用户快速掌握研发资源的当前状态。包括软件资源、计算节点状、集群列队、工作目录等4个子功能。

作业提交

用户可以将CAE作业提交到服务器端的资源池进行计算处理。系统提供可视化操作,支持多文件作业批处理,并把计算结果存放在以作业名命名的文件夹下,易用性强,实现了良好的人机交互。PERA.GRID提供了便捷、稳定、支持大文件的作业提交功能。

图形终端

可以方便地在WEB页面直接启动图形终端,不需要任何命令设置,,并实现ANSYS Fluent等作业的可视化,方便用户观察收敛曲线参数。

 

系统管理

系统管理模块主要由帐号管理、授权策略以及系统设置三部分组成,由管理员进行操作,用以管理整个HPC作业系统中的用户,License和PERA.GRID相关参数的设置。另外,还包括对集群上的作业进行汇总统计的功能。

帐号管理

系统设置

License授权管理

客户价值

●易用而稳定的高性能计算平台,大大降低用户使用HPC集群的使用门槛,,使对HPC集群仿真不熟悉的用户用对、用好HPC集群

  - 节约仿真工程师的宝贵时间,使其把精力放在业务层面,而不是如何操作Linux系统来提交和管理作业

  - 防止由于误操作造成的系统拖慢或崩溃,使整个HPC平台更加健康稳定

●深度结合CAE软件的系统特性贯穿于用户仿真的整个过程

●将CAE仿真,尤其是针对ANSYS系列软件的HPC仿真的最佳实践融入进来,优化求解速度,提高集群求解大规模计算的能力

●远程可视化使整个计算对仿真用户更加透明化

●方便快捷的管理功能使管理员可以轻松地掌控整个集群,传统上要使用命令行的操作全部采用界面鼠标操作,大大降低管理和拥有成本

典型应用

PERA.GRID在工作组级仿真环境中的应用

项目背景

某著名高校环境系教研室,科研项目中长期采用流体仿真技术进行项目攻关。该教研室的学生一直采用工作站的方式来进行计算求解,导致稍微复杂一点的问题就可能耗费一个甚至几个星期,而且在Windows系统上进行大规模流体仿真,一旦CPU和内存资源不足,便会极不稳定,频繁死机。因此,系领导采购了一套基于Linux的8节点HPC集群并购置了并行License,建立了工作组级的CAE HPC仿真计算集群。但由于对集群操作缺乏了解,导致误操作频频发生,各种作业提交问题不断。同时该教研室大量的自研并行软件,由于没有系统的提交入口,资源分配和作业排队机制,只能采用命令的方式盲目提交作业,导致因为资源分配问题使某节点上运行过多的作业,而有的节点却一直闲置的问题。 

另外,学生手动提交作业由于不收敛而强制杀死进程导致僵尸进程占据系统资源,有时候还会占据License资源且不释放,极大地影响后续使用。此外老师和学生公用一套系统,也会出现争抢license的情况。

解决方案

  • 使用PERA.GRID简易且功能强大的提交作业功能,轻松应对Fluent等商业软件的作业提交,中间结果保存以及安全退出等需求,无须手动杀死任何进程。
  • 通过免编程的模板定制功能,将用户自己研发的并行求解器可通过图形界面轻松提交。
  • 通过PERA.GRID将作业文件上传,求解设置,求解过程监控以及结果文件下载等一系列操作一键完成,无须输入任何命令行。
  • 灵活的调度策略,给不同的学生和老师分配不同的计算资源。
客户价值
  • 学生无需在字符界面下敲命令就可以提交作业,不易出错。即使出现了不收敛等求解问题,也可以方便地停掉相关进程,无需到系统中手动杀死进程,提高了系统的稳定性和易用性。
  • 将自研软件很好地纳入到作业排队系统中,防止资源的无序使用。
  • License授权策略模块可以很好地解决License争抢的功能,为有重要的任务的老师和学生预留License资源。