这部分文档将介绍创建和使用E-HPC集群的基本流程,引导您一站式完成集群的创建、配置并在E-HPC集群上完成高性能计算作业。
说明:本文档的操作仅适用于Web端管理控制台。如果您是 API 用户或有批量操作需求,请参考E-HPC OpenAPI概览。
购买和使用弹性高性能计算 E-HPC 集群进行高性能计算,一般遵循以下步骤:
-
RAM授权与开通NAS服务。
首次进入E-HPC控制台会弹出对话框提示进行RAM授权,点击“前往RAM进行授权”按钮,在跳转后的页面中点击同意授权即可。
E-HPC集群使用NAS共享文件存储,因此在创建E-HPC之前需要先开通NAS服务,您可以登录文件存储产品页面 开通NAS服务。
-
创建集群。
集群是用于高性能并行计算的资源集,由阿里云弹性计算实例组成,E-HPC集群部署完成后即包含了调度管理集群资源的高性能调度器,以及运行业务所需的软件栈。请参考创建 E-HPC 集群流程完成集群的创建与配置。
-
添加用户
E-HPC需要使用非root用户提交作业,因此在提交作业之前,您需要先通过用户管理功能添加用户。
-
创建提交作业。
集群和用户创建完毕,即可向集群提交计算作业。E-HPC控制台提供了图形化的作业编辑、提交流程,请参考作业提交流程完成作业提交。
您也可以通过SSH方式登录集群,使用命令行进行作业提交操作,参考命令行提交。
-
运行监控。
通过E-HPC的集谛功能,用户可以实时查看集群运行性能,剖析性能热点,也可以查看历史作业运行时的性能数据。
-
结果可视化。
通过E-HPC提供的远程可视化功能,用户可以通过GUI查看作业的运行结果。