广州大学

帮助广州大学高效管理校园高性能计算(HPC)资源

广州大学是广州市重点支持的高校之一,其授课领域包括计算机、数学、化学、物理、地理等学科,其中化学、物理、地理学等属于传统学术领域,在这些领域中进行创新往往伴随着缜密的算法以及大量的数据论证,这需要大量计算和存储能力予以支持,并且需要配合各类高性能计算(High Performance Computing,HPC)软件的支撑,比如天体物理学中预测卫星变化轨迹的算法论证,就需要使用MatLab软件加上数十台服务器同时运算数周才能得到结果,并且需要数十T的存储能力。而卫星轨迹变化的例子只是众多高性能计算需求中的其中一例而已,这对广州大学的硬件资源以及网络中心的服务支撑能力提出了挑战。

这种自助化服务的模式真好,我不用再操心软硬件的配置,并且随时都有资源可用,可以大大提高我们项目组的工作效率。

——广州大学高性能计算项目组负责人

核心问题

+客户面临的多重巨大挑战

HPC资源分散化
在传统模式下,实现HPC能力需要由教师或院系自行购买相应的设备,成本极高,但项目结束后资源却往往处于闲置状态,分散化的资源没有集中管理。
HPC软件部署难度大
HPC软件属于专业软件,商业化的HPC软件和开源免费HPC软件在手工配置安装过程中都十分复杂,操作失误极易导致配置失败,而这些往往与师生的研究领域无关,导致了较高的学习成本。
数据存储成本攀升
HPC与大数据(big data)有着密切联系,据估算,广州大学天体物理学的卫星测位计算会生成近20T的数据,其他课题的数据规模也与此类似。由于校内采用成本高昂的SAN存储系统,因此不可能全部满足所有课题的需求。
网络中心服务价值难以体现
网络中心需要协助HPC课题组调试软件和网络,并且配置与安装服务器,但这些工作往往难以计量。例如今年服务了多少个项目组、安装配置了多少高性能计算软件、一共交付了多少硬件资源。最终难以体现数据中心的服务价值。

解决之道

+BingoCloud帮助客户巧妙应对多种难题

整合IT资源,提高资源利用率

由网络中心集中化规划、采购软硬件资源,使用BingoCloud™将其连接成一个整体,供课题组或师生按需划分、使用。采用资源置换的方法,逐步吸纳项目组闲散资源到云平台中,进一步提高全校硬件资源的利用率。

按需自动部署环境,降低使用复杂度

使用BingoCloud™的自助服务平台,课题组可以从服务目录中选择HPC软件如MatLab等,然后只需输入集群规模,云平台会自动生成环境,无需管理员操作,降低管理维护成本。管理人员也可以使用方便的工具,依据需要扩充软件种类或升级软件。

降低存储成本,提高数据安全性

使用多台利旧x86服务器组成了分布式存储集群,可提供科研所需的全部存储能力,且成本仅是SAN存储的十分之一(1/10)。通过自动冗余&备份技术,使保存在分布式存储中的数据实现高可用,保障数据的安全。

自动服务计量,凸显网络中心价值

网络中心云平台对外提供的各类服务,如HPC服务,存储服务,备份服务等,均有服务目录详细列出,使网络中心的服务能力具体化。项目组、师生在云平台中使用的各类资源均被详细记载,方便统计网络中心所服务的客户信息和享受的云服务情况,且可以生成报表或导出Excel文件进一步分析,充分体现网络中心服务价值。