伴随现代科学疆界的不断扩展、以及数字世界与物理世界的深度融合,高性能计算在近 20 年间维持了辉煌的“十年千倍”增长规律,远超摩尔定律,其应用模式也从传统的计算模拟与数字仿真走向“科学研究第四范式” —— 即基于大数据相关性分析的科学发现和研究。
我国高性能计算崛起于“863”计划、国家重点研发计划等国家统筹支持,超级计算机曾连续 5 年 10 届问鼎世界 TOP500 排行榜榜首,并由此走入大众视野。时至今日,我国高性能计算已不仅面向前沿科学研究、服务国家突破战略科研领域,更将作为驱动产业转型升级的新动力,在生命科学、先进材料、能源、工业仿真、遥感计算、深度学习等产业领域产生愈发深远的辐射带动作用。
图:TOP500 算力增长趋势(数据来源:www.top500.org)
但在璀璨光环的背后,我国高性能计算的核心价值远未得到充分发挥,其商业化、生态化、产业化道路依然充满挑战。
一方面,“大计算”与“大数据”的融合已成为最具确定性的应用创新趋势,日渐丰富的大数据/AI 应用迫切需要支持多种处理模式的异构融合计算平台,尤其是大数据的多源性、多样处理模式、复杂数据访问模式,都对传统超算中心的平台架构设计、存储管理、数据分析挖掘等诸多方面提出了严峻挑战。
另一方面,国家科研项目的资助模式和管理方法适用于单点突破,虽然推动了我国超算数据中心的飞速崛起,但依然缺乏全局生态环境的顶层布局和产业化持续造血能力,底层硬件、系统软件、应用、开发套件的深度协同需要基于完备的产业链生态,其中,更高效、更便捷、更低成本的商业模式是不可或缺的基石。
随着我国高性能计算逐渐进入到以应用需求为导向的发展阶段,面向大数据应用的异构算力开始在重点领域迅速落地,政府机构、高校院所、云厂商、第三方超算运营平台等多方力量也在积极探索高性能计算的商业化、生态化、乃至产业化新模式。
例如,在生命医学领域,从神经内部结构三维立体重建、到高通量虚拟药物筛选、再到多源异质组学数据的融合挖掘,快速增长的多样化应用亟需基于多尺度、多模态数据实现关联分析,基于深度学习的任务调度、程序性能优化至关重要。为支持上述应用,高性能硬件也从单纯面向科学计算转向兼顾 AI/大数据应用,NVIDIA 深度学习优化 Tensor Core GPU,以及 Google TPU、寒武纪 MLU、FPGA、ASIC 等深度学习处理器/加速部件都得到了广泛应用。
在产业化方面,中国国家网格是我国超算由政府主导走向需求引领的率先探索,依托国家“863”计划,中国国家网格旨在建立具有新型运行机制和丰富应用资源的、实用型的高性能计算应用服务环境和应用领域社区,目前接入了 6 家国家超级计算中心,以及上海超级计算中心、中科院超级计算中心 2 个主节点。
众多高校、科研院所也更倾向于将自建的超算中心与云计算打通,为科研人员、教师、学生等多样需求提供集约化、弹性、便捷的超算服务。此外,北京超级云计算中心则通过政府与超算运营平台联合运营,探索超算商业化新模式,上海超级计算中心也在积极探索面向公众开放的商业化超算服务。
青云科技(qingcloud.com,股票代码:688316)作为一家企业级云服务商,也是一个基于云模式的综合企业服务平台,始终致力于探索为行业应用提供丰富多样、灵活便捷、低成本的算力服务模式。
在我国高性能计算深度融合大数据应用、探索商业化路径的过程中,青云科技提出一种:基于公有云 IaaS、PaaS 层基础架构的高性能计算方案,提供从上云计算到结果产出的全流程 SaaS 化计算服务,真正实现高性能计算资源的弹性伸缩、按需计费、无需运维等“云属性”。
11 月 23 日,青云科技将重磅发布 —— QingCloud EHPC 高性能计算平台,为您解锁新算力、新架构、新服务,传递极致算效的最佳实践!