经历近一年筹备建设,西交利物浦大学超算平台于近日正式启动运营。西浦超算平台面向全校科研人员提供稳定、高效的算力支撑服务,满足大学多个科研领域对计算能力的需求,助力大学科研发展。
据悉,该平台采用先进的CPU和GPU异构计算构架,第一期包括两个CPU计算节点、一个大内存胖节点,六个搭载NVIDIA RTX3090八卡GPU节点,二个搭载NVIDIA A800四卡GPU节点,平台共享容量可达648TB并存存储。
以服务创造价值
2023届生物科学系的本科毕业生曾一格在她的毕业论文致谢中除了论文指导导师,还特别感谢了大学管理信息技术与系统办公室(MITS)的教育系统工程师郭永富。
曾一格的毕业设计主攻生物信息方向,完成研究课题需要扎实的计算机功底。当她遇到技术操作上的疑问和难题时,主动向MITS的专业人员求助。郭永富老师是高性能计算平台运营维护方面的专业人士,在加入西浦前有数年的业界经验。他从最开始帮助曾一格安装生物计算相关的软件开始,根据学生的问题,逐步教授一格进行软件的调试、编写资源调度脚本、指导她下载公开的生物数据库(NCBI)数据……
曾一格以优异的成绩毕业,随后前往美国留学。她在毕业论文致谢中写道:“在郭永富老师的耐心帮助下,我学习到了在机群计算机上进行数据处理和分析所需的能力,这些对我未来的学习和研究至关重要。”
MITS主任冯旭东介绍说,超算平台不仅为大学的科研活动提供算力支撑,另一个重要的价值就是承担专业的技术支持和运维管理服务。
“以超算平台为契机,拓展助力科研发展的信息技术服务、为科研人员创造更为友好便捷的技术支持是MITS接下来要重点着力的领域。”他说。
优化管理 降本增效
助理副校长(科研)马飞教授是超算平台的用户,也是筹备建设期专家咨询小组的成员。
他所在的数学和物理学院有不少研究人员的科研课题对算力有较高的要求和需求。在校级超算平台成立之前,各学院在每个学年的预算周期之初根据研究需要提出相应算力需求的预算申请,待预算审核审批之后,各自采购资源用于支持各自的科研活动。
马飞教授提到这种模式存在的一些局限性,“由于院系不设专业的运维人员,设备相对缺少日常维护,软件更新也不及时,影响了设备的易用性、稳定性和安全性;另外,各学院的算力资源是独立分散管理的,也会出现资源闲置和使用效率不高的情况。”
在新的模式下,由大学知识与信息中心MITS办公室负责大学超算平台的建设和管理,提供全面的算力技术支持和运维管理服务。
冯旭东主任介绍,超算平台的方案由MITS经调研论证提出,在筹备和建设过程中获得了由校内科研人员代表组成的专家咨询小组的大力支持。目前采用自建和与学院共建的模式运行。MITS根据各学院每学年提出的算力申请,以及对上一学年资源使用效率的评估,对下一年度的算力资源进行集中配置,在保障各学院的优先使用权之余,对闲置算力资源根据需求再进行合理配置。除了优化算力资源配置和使用效率之外,MITS还负责设备的日常运维延长设备使用年限,由专业人员为用户提供技术支持服务提升用户体验。
管理模式的优化还有效降低了大学运营的成本。据了解,超算平台的建成投用在当年即为大学在相关算力资源的投入上节约了约1000万元。
服务大学科研发展 呼应地方产业战略
近年来,西浦持续加大科研发展力度。助理副校长(科研)马飞教授表示,西浦一方面持续支持科研人员的自主研究兴趣,鼓励和支持原创性科学研究;另一方面,随着大学发展3.0战略的推进和深入,西浦的科研发展方向紧密结合区域重点发展的战略性新兴产业,重点布局生物医药、人工智能、材料等领域。
在这一背景下,各学院的科研人员人数和横向项目、纵向项目数量持续保持较高增速,对相关算力的需求也呈现快速增长的趋势。
马飞教授对超算平台的建设给予了大力的支持和很高的期望:“西浦超算平台的建设不仅提升了大学研究资源的管理效率和科研公共服务的水平,而且将为大学的学科发展和重点科研领域的建设提供稳定、高效的算力资源支撑。”
西浦知识与信息中心主任毕新博士表示,随着西浦超算平台的建设和管理水平的提升,未来计划将大学的算力资源逐步开放给苏州的科研院所和企事业单位,提升大学对地方发展的贡献度,助力苏州打造全国算力产业高地和全国数字化发展标杆城市。
记者:寇博 图片提供:管理信息技术与系统办公室
来源:西交利物浦大学