文| 香港 冯琳
4月11日,国家超算互联网平台正式上线,依托一体化的算力调度、数据传输、生态协作体系,实现算力供给、软件开发、数据交易、模型服务等产业链主体的紧密连接,构建市场化、互联网化、服务化、标准化的高性能计算服务环境,打通算力服务“最后一公里”,成为支撑数字中国建设的“高速路”。为深入了解相关情况,本刊记者采访了中国科学院院士、超算互联网总体专家组组长钱德沛。
我国超算事业已达国际交替领先水平
记者:什么是“超算”,与普通计算相比有什么区别?
钱德沛:“超算”实际上是高性能计算机一个比较通俗的说法,是为了让大家理解它与普通计算的区别。第一,超级计算机的运算速度大大超过普通计算机,这是性能问题。第二,超算的存储容量更大,网络带宽更高,是由并行的操作系统来管理。它不是一个或几个单独处理器,而是成千上万个处理器一起工作。第三,超级计算机上运行的软件主要是大规模的并行软件,而不是普通计算机上的串行软件,也就是说,它把一个特别大的挑战性问题分解成很多小问题,再由成千上万个处理器一起工作来求解,比如全球气候变化、新材料、新能源、生命科学等这样的大问题。求解这些不同类型问题所需要的计算系统就是超级计算机。在不同阶段,超级计算机的“超级”有不同的指标。比如说,我们现在的笔记本已经比30年前最快的超级计算机的运算速度还要快,这是技术进步的结果。普通计算机和手机的运算速度都快了,那么相应的,超级计算机的运算速度也就更快。
记者:我国超算事业有著怎样的发展历程?目前在世界处于什么水平?
钱德沛:中国的超算经过了至少40多年的发展历史。最早可以追溯到上世纪80年代初的银河计算机,但是当时这还属于个别科研项目。超算作为国家投入比较大的、有更多人参与的科研项目,主要源于国家高技术研究发展计划(“863计划”),从上世纪90年代初开始进行超级计算机整体研发。
自此,按计算机性能划分,我国的超算事业经历了四个发展阶段,每个阶段计算机性能提高1,000倍,即从G级(每秒10亿次)到T级(每秒万亿次),再到P级(每秒1,000万亿次),再到E级(每秒百亿亿次)。相对应的典型计算机系统是早期的曙光1000(G级),20世纪末的曙光3000(百G级),本世纪初的联想深腾6800和曙光4000A(T级),接著是天河一号、曙光6000和神威.蓝光(P级),神威.太湖之光和天河二号(百P级)等。国家“十三五”计划提出要突破E级(1000P级)计算机核心技术,也已实现了研究目标。
实际上,我们每跨越一个台阶都要花费很大的力气,而且随著性能的不断提高,我们愈发强调要依赖自主可控的技术。我国的超级计算机在刚开始研发的时候,使用的是国外的处理器,到后来,我们先在互连上实现国产化,接著又实现处理器国产化,最终我们现在的超算系统从处理器到互连整体都实现了国产化。
在1995年时,我们的超算发展和国外差距很大,后来这个差距逐渐缩短。比如,1997年国际上第一台万亿次计算机出现了,而我们是在2002年才达到这个速度,与国际领先相差了5年;到2010年,我们在千万亿次计算领域就走到了国际前列;后来在E级计算机出现之前,我们的神威·太湖之光和天河二号这两个系统多次保持世界第一。我们的超算事业从跟著人家跑,到和人家并跑,到现在已经可以与美国、日本等在国际上交替领先。
借鉴电商模式推进普及超算应用
记者:近日,国家超算互联网平台上线,为什么要建设国家超算互联网平台?
钱德沛:其实国家超算互联网平台这一概念出现得很早,我们在1997年就提出要建立网格化的计算环境——国家高性能计算环境。就是要通过互联网把主要的超级计算机连接起来,构建一个可以随时随地访问的计算基础设施,也就是国家高性能计算环境。它看起来是一台计算机,但实际上是由多台计算机组成。用户可以在任何地方提交计算任务,也不用关心其任务具体在哪台机器上执行,这相当于一个虚拟的计算系统。
建设这样一个国家级的网络计算环境,让不同的计算机能够通过网络连接到一起、能够被方便地访问,需要解决很多技术问题,包括网络系统的互联互通、存储系统的统一管理、作业的远程提交、全系统的资源管理,以及安全、用户统一管理等问题。这项工作从1999年开始正式实施,到现在20多年了,主要技术问题基本都解决了。
但我们仍遇其他的问题,国家高性能计算环境虽已运行多年,但用户还不够多,整个环境的运行机制和各个计算中心的运营机制有时还不统一。究其原因,是因为各计算中心的计算机主要是所在地方和部门购买的,各中心有各自的考核指标、各自的长期用户和相应的运营管理方式,还不是完全按照统一的国家级网络计算环境的机制在运行。另外还涉及到应用软件资源问题,应用资源很宝贵,各中心购买的应用软件,一般也不会免费让别人使用。这些体制、机制上的问题,造成整个国家高性能计算环境的使用仍然不够普及,尽管有一些技术手段支持,但还没有用得很好。
现在提出要建立国家超算互联网平台,主要是借鉴了20多年来在互联网上发展起来的一些其他应用经验,比如电子商务。为什么网购平台能够在十几年时间内达到今日的规模?它就是利用了互联网的一些特点,加上商业运营的模式和机制,再加上极大丰富的商品,这些要素凑到一起,就形成了基于互联网发展业务的模式。所以我们想借用这种模式在超算领域进行推广,希望以此促进超算的普及应用。
我们依托国家超算互联网平台,利用互联网理念来发展超算领域的新业态和新机制。首先要解决算力资源分布不均的问题,这在我国东部和西部、经济发达地区和经济不发达地区都存在。应用分布也不均匀,有些地方用户多,有些地方少。其次,要解决应用普及问题,就像网购可以买到的商品是多种多样的,我们也要把超算的应用资源丰富起来,让应用软件更多,才能让应用得到普及。第三,要发展一种新的业态,让超算不再是少数个别人(如科学家或工程师等)所关心的事情,而是能够成为一种新的业态,让更多的人可以依靠超算互联网发展业务、赖以谋生。
这就是我们建设国家超算互联网的初衷。我们希望把超算互联网变成这样一种新的形式。当然,要实现这些目标还有相当长的路要走,不光是技术手段,还有很多思想理念和体制机制上的问题要解决,要变革。
为国家创新发展提供基础算力支撑
记者:国家超算互联网平台上线后将为我国经济社会发展作出哪些贡献?
钱德沛:计算是我们创新型国家建设以及经济社会发展的一个基础性资源,很多问题都需要倚赖计算的帮助来解决。这在过去只有少数人理解,但现在越来越多的人认识到这一点。特别是近年来人工智能发展得很快,没有计算,新一代人工智能根本就无从发展。
所以第一,国家超算互联网平台的建立能够对我们国家的创新发展提供一个基础的算力支撑。依托这一资源我们才能发展其它领域,而且能够进一步提高其应用水平,让更多领域能够利用计算来求解难题。第二,有助于科学发现,比如新材料的发现。像材料基因组计划,如果离开了计算手段,就根本没办法实施了。第三,提高社会管理水平。我们现在一些政策的制定,是靠拍脑袋凭经验的,而没有真正通过计算来模拟一个政策的推出会产生什么样的后果。所以在整个人类社会发展或者在国家治理方面,超算应该能发挥很大的作用。第四,与老百姓的生活密切相关。我国正渐渐进入老龄化社会,健康医疗是老百姓关心的大问题,我们通过计算所支持的智能及精准医疗等方式可以提高医疗水平,促进人民大众的身体健康。这些都是超算互联网应该关注、也是能够作出贡献的领域。
记者:我国超算事业未来的发展方向是什么?
钱德沛:我认为主要是算力、应用和人才三方面。超算的发展一定要致力提高整个社会的算力水平,这一方面依赖于处理器性能、存储器性能的提升,还要提高连接成千上万个、甚至数十万个处理器的系统互连水平,使互连网络的结构更合理、带宽更大、时延更低。另一方面要降低能耗,要通过系统结构的创新和软件硬件的协同来降低超算系统能耗。
应用方面,则要不断丰富应用软件。就目前来看,我们的超算应用软件很大比例还是进口,所以一定要发展针对我国自主超算系统的应用软件,特别是大型的并行应用软件。
人才方面,超算要普及发展必须是千军万马,而不是少数人的事。所以怎样培养更多能熟练掌握计算这个工具的人才,是未来要著力发展的方向。国家重点研发专项支持了高性能计算教育实践平台的发展,通过这个平台,提供培训的课件,支持几十所高校高性能计算课程的建设,还提供免费机时,让学生能够免费上机。
香港信息技术产业发展前景良好
记者:您如何评价香港信息技术产业的发展,您认为香港在国家超算事业中可发挥哪些作用?
钱德沛:香港在中国的信息技术产业发展方面,曾经起过非常重要的作用,而且将来还会持续发挥作用。
改革开放之初,内地人都想到香港或者是通过各种渠道买到香港的电子产品,比如电子表、收录机等。这些东西当时在内地还属于稀罕物,而在香港已经大量生产了。后来随著内地的科技进步,包括电子信息技术的进步,两地的差距越来越小,香港在产业上的优势就显得不那么突出。
但作为一个连接中国和海外的重要节点,无论是外来技术、器件、产品的引入,还是内地的技术产品“走出去”,香港在中国信息技术产业的发展过程中一直发挥著非常重要的“中间站”作用。今天,香港依然是内地和世界交往的一个“超级联系人”。
当然,香港的作用绝不仅限于此。第一,这三十多年来香港的高等教育有了长足进步,包括学术和人才培养方面。香港高校有相当高的与国际接轨的学术水平,为信息产业的后续发展提供了良好的人才基础。第二,香港在信息技术产业发展方面有独特优势,市场理念比较好。香港培养出的人才更贴近市场,经营观念或者通俗点说“我要赚钱”的观念更加强烈,例如我国知名信息技术企业——“大疆”和“商汤”的创始人,都有过香港教育研究的浸润。第三,香港早在20多年前就已经实际参与到国家超算事业中。在国家高性能计算环境中,香港大学计算中心是一个结点。在国家科技项目实施和人员互访中,是很活跃的一员。在解决流体力学问题、计算金融问题等方面,香港都有很好的超算应用基础。所以香港有特色的软件完全可以通过国家超算互联网平台来对外提供服务,当然香港也可以使用国家超算互联网平台的计算和软件资源。
香港规模体量并不是足够大,还需要依托祖国一起发展,特别是要融入大湾区、融入国家发展战略全局。如此,香港的人才、市场、国际化的优势就能更好地发挥,香港的信息技术产业会有更好的发展前景。
https://res.youuu.com/zjres/2024/5/31/2t8YGWeAo3LxBTBFNzq9noKoIfXZIBVYnUy.png
扫描二维码分享到手机