文 | 黄锦辉
要打造香港成为国际创科中心,官、产、学、研、投各界必须携手着力建设“数据、算法、算力”三大关键技术平台。例如,专家估计2024年互联网上的数据多达150皆位元组(Zettabyte, ZB, 1021);又例如,生成ChatGPT-4的深度学习网络利用了1.8兆个参数;要高效地处理那么庞大的数据及参数量需要庞大的算力,远远超于传统电脑系统所能及。因此,全球计算机科学家及工程师都在埋头苦干地研发“高性能计算”(High Performance Computing, HPC)技术。
HPC是指使用超级电脑或大型计算机集群,以大规模的计算能力来解决复杂的问题(例如生成式人工智能, GenAI)。许多前沿科技(例如大型语言模型, LLM)都需要庞大的算力来进行数据分析和模拟,只有通过HPC 才能有效处理并达成目标。HPC的挑战在于其本身对于很多种技术有很高的要求︰硬件方面,建立超算中心需要高性能的处理器、大量的储存空间和稳定的网络设施;软件方面,需要专门的管理组织软件、算法和优化工具来充分发挥硬体的计算能力;还要有能够有效操控现代计算技术的人力资源。因此,HPC是一项非常复杂且需要大量资源投入的工程。
特区政府于2022年底发表了《香港创科发展蓝图》,提出人工智能、生命健康科技,以及先进制造与新能源科技为三大聚焦产业,这些领域都与HPC有着密不可分的关系。人工智能(AI)是目前创新及科技界最热门的话题,尤其是生成式人工智能(如ChatGPT)等系统风靡全球。连今年的诺贝尔物理学和化学奖也都与人工智能息息相关,显示出人工智能在科研中的巨大影响力。人工智能技术的基础便是HPC,像ChatGPT这样的人工智能模型,是建立在由数万个“图形处理器”(GPU)及“中央处理器”(CPU)组成的一个巨大的“超级大脑”,用来处理海量的文本、图像和数据。最近,特斯拉总裁马斯克(Elon Musk)甚至建立了一个由十万个GPU组成的超级计算集群,以进一步发展人工智能技术。
生命健康科技也是《香港创科蓝图》中的重点发展方向之一,而这个领域同样需要HPC 支援。以诺贝尔化学奖背后的关键技术 AlphaFold 为例,它利用高性能计算成功解决了蛋白质结构预测的超级大难题,这一突破对于生命科学和医药研发具有划时代的意义。基因组学、大数据分析和生物讯息学的研究,都需要巨大的计算能力来进行数据处理和建模分析。因此,HPC在生命健康科技的研究中不可或缺。再看先进制造与新能源科技发展,在制造业中,从计算机辅助设计(CAD)到计算机辅助工程(CAE),再到晶片设计,这些都依赖于HPC的精确模拟和数据分析。又例如在能源领域,核聚变作为最具前景的清洁能源解决方案,也需要大规模的数值计算来模拟核反应过程,对HPC有巨大的需求。
凝聚HPC持份者组业界生态圈
为了应对创科对于HPC的需求,香港政府近年来加大了对HPC的投资,在美国禁运之前购买了数千张 Nvidia的先进GPU卡,用于香港建立一个拥有300多个计算节点的超算中心(Supercomputer Centre),期望不久将来能向科研社区开放。然而,建设一个超算中心并非易事。正如中国工程院倪光南院士在最近的演讲中所指出,建设一个大型高性能计算集群是一个复杂系统工程,具有多层次性、动态性和不确定性等特征。
每一个科研创新机构对计算资源的需求都是动态变化的,拆分成小集群后,既不能有效处理大型科研项目,又容易造成资源闲置。超算中心的主要价值在于能够将众多不同规模的科研项目整合起来,以最有效方式分配组合使用计算资源。中国内地近年来建设了多个大型超算中心,深圳市亦不甘后人,它们的经验和技术的确很值得香港借鉴。
在香港推动高性能计算,除了超算中心的建设之外,还有两个重点:一是 HPC生态环境的建设,二是HPC人才的教育和培养。在建设HPC生态环境方面,长期以来不少政府部门,例如天文台进行天气预报、环保署研究污染、医管局的医疗大数据分析等,都大量使用HPC;大学科研单位在许多研究领域中也经常使用;近年来,随着AI应用的兴起,工商业界对计算资源的需求更是急剧增加。由此可见,当前是一个适合时机,凝聚香港官、产、学、研各界的HPC持份者,组织一个有机、互动的业界生态圈,配合香港政府对创科及高性能计算的投入。为此,笔者联同与一众HPC志同道合人士创办了香港高性能计算学会,旨在为香港建设一个HPC的互动交流平台,让各界习思广益,一同推动香港HPC的应用、研发及人才培养。
(作者系立法会议员,文章仅代表作者个人观点)