学生电脑排行榜
优先
发表
人工智能已和科学与工程计算一并成为高性能计算中的最为重要的两种应用类型,在2020年11月15日举办的中国超级算力大会上,张云泉研究员等发布了中国高性能计算机性能TOP100排行榜。此次大会汇聚国内外院士、知名学者和产业大咖,聚焦超级计算、新基建、云计算、大数据、人工智能、区块链等新一代信息技术、前沿技术进展。根据TOP100排行榜的数据,该团队撰写了文章《2020年中国高性能计算机发展现状分析与展望》对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。在此基础上,文章根据十九届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析预测。
本文将发表在《数据与计算发展前沿》2020年第2卷第6期上,欢迎阅读。
2020年中国高性能计算机发展现状分析与展望
张云泉1,袁良1*,袁国兴2,李希代1
1.中国科学院计算技术研究所,计算机体系结构国家重点实验室
2. 北京应用物理与计算数学研究所
摘 要
【目的】本文根据2020年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。
【结果】中国TOP100的平均Linpack性能继续保持比国际TOP500平均Linpack性能高的局面,且TOP100的入门性能门槛仍然超过TOP500。中国TOP100上的超级计算系统出现了新面孔,Dell公司的一台机器上榜,打破了榜单连续两年全为国产超算系统的记录。联想为系统数量冠军,联想、曙光和浪潮三强争霸的局面继续保持。
【结论】在此基础上,本文根据十九届排行榜的性能数据,对未来中国大陆高性能计算机的发展趋势进行了分析预测。根据新的数据,我们认为:峰值Exaflops的机器将在2021年到2022年间出现。
关键词:高性能计算机;TOP100;排行榜;性能;分析
背 景
在国际上,自1993年起每年都会按Linpack的测试性能公布在世界范围内已安装的前500台高性能计算机排行[1],成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。
在2002年之前,我国的高性能计算机未曾向国际申报Linpack性能测试结果,故而未列入国际TOP500排行榜。在中国软件行业协会数学软件分会发布首次中国高性能计算机排行榜的2002年当年,就实现了零的突破。在中国TOP50排行榜中名列第一的联想深腾1800万亿次机群名列2002年世界TOP500第43名,结束了在世界TOP500排行榜没有国产高性能计算机的历史。2003年,在中国TOP100排行榜中名列第一的联想深腾6800万亿次机群名列2003年世界TOP500第14名,达到了国产高性能计算机的历史新高。2004年,在中国TOP100排行榜中名列第一的曙光4000A更是取得了6月份 TOP500排行榜世界第十的历史性突破,引起世界关注。2010年9月发布的国产天河一号A千万亿次超级计算机通过采用先进的CPU+GPGPU的异构混合加速体系架构,以2.56PFlops的Linpack性能夺取2010年11月国际TOP500排行榜的第一名,是中国国产超级计算机首次夺得世界冠军;我国安装的超级计算机的上榜数量也首次超越日本和欧盟,排名世界第二,仅次于美国,标志着我国超级计算机硬件的研制水平达到国际领先水平。2013年,我国的高性能计算机科研工作者戒骄戒躁,刻苦攻关,勇攀高峰,于2013年6月凭借由国防科大研制的天河2号超级计算机,再次夺取世界TOP500第一名。迄今为止,中国研制的天河系列超级计算机已经七次夺取世界第一,天河二号更是取得了六连冠的辉煌成绩,牢牢占稳了中国在世界TOP500超级计算机冠军俱乐部中的位置。安装在中国大陆的超算系统在2016年6月和11月的TOP500上的数量再创历史记录,6月份在历史上首次超过美国,排名世界第一且11月份继续保持与美国持平;而联想生产的超算系统上榜数更是历史性的首次闯入世界前二强,仅仅排在第一名美国HPE之后。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。2016年,中国超级计算系统不仅连续八次夺取TOP500世界第一,连续两次夺取TOP500数量冠军,更是在SC 2016大会上首次获得戈登贝尔奖。更为可喜的是,中国科技大学由安虹教授带领的大学生团队更是代表中国一举夺得世界大学生集群大赛的Linpack单项冠军和总冠军,2016年对于中国超算界来说,可以骄傲的称之为“中国超算大满贯年”。2017年,中国超级计算系统继续保持上升势头,太湖之光继续领跑,与天河二号一起连续五年共十次夺取TOP500世界第一,创下新的历史记录。中国团队在SC 2017大会上再次获得戈登贝尔奖。2018年11月公布的TOP500榜单中,我国以227台数量远超第二名美国的109台。我国联想制造的超算系统达到140台,位列厂商第一,浪潮和曙光分别以84台和57台位列二三名,三家厂商占据281台超过一半,出口54台。2019年11月公布的TOP500排行榜中,我国228台数量远超第二名美国的117台,其中联想达到174台,较之去年又有大幅提升,曙光和浪潮以71和66台位居二三位,三家单位合计311台,这充分说明了我国超算发展已经牢牢占据领先地位。2020年11月公布的TOP500排行榜中,我国继续以213台数量远超第二名美国的113台,其中联想达到181台,继续保持增长态势,浪潮和曙光以66和51台位居二三位,三家单位合计298台,这充分说明了我国超算发展已经牢牢占据领先地位。
超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点,以超级计算机系统为核心的算力经济时代已经到来。经过三十年的快速发展,中国研制超算系统的能力已经跻身世界先进水平的行列。美国虽然仍是世界超算的强国,但是其在TOP500上的数量已经降低到不足25% 的份额,难以恢复二十年前独霸世界TOP500 70%系统的盛况。
此次测评按国际惯例选用Linpack测试(HPL)[2],2008年9月底发布最新的2.0版本。本文给出对中国计算机学会高性能计算专业委员会与中国工业与应用数学学会高性能计算与数学软件专业委员会于2020年11月发布的中国高性能计算机性能TOP100排行榜[3]数据的深入分析与展望。文中的图表数据主要来源于中国HPC TOP100。以下将中国HPC TOP100简称中国TOP100[3-7]。
1
总体性能分析
本节图1和表1分别给出的是中国TOP100的总体性能发展趋势图以及TOP10计算机情况的列表。
图 1中国高性能计算机年度性能发展趋势(2002-2020)
Fig.1 The performance trend of HPC TOP 100 (2002-2020)
表1中国TOP100排行榜TOP10(2020.11)
Table 1 The top 10 systems (2020.11)
和2020年11月发布的世界TOP500高性能计算机的情况相比较,可以看到:
(1)2020年11月世界TOP500总Linpack性能达到了2430PFlops,是2019年1646PFlops的1.47倍,增速较之去年的1.16倍有较大幅度增加;根据2020年中国TOP100排行榜的数据,中国TOP100的总Linpack性能是384.2 PFlops,是2019年347.1PFlops的1.11倍,增速与去年的1.13倍相比继续减少。这说明中国超级计算的发展速度有所降低。
中国研制的神威太湖之光超级计算机,以93PFlops的Linpack性能,蝉联了四次世界TOP500冠军,使得中国研制的国产超级计算机在世界TOP500的冠军位置上保持的次数达到了历史性的十次!2020年日本制造的Fugaku超算系统登顶TOP 500榜首,峰值首次突破500 PFlops,Linpack性能达到442 PFlops,2018年美国制造的两台超算系统Summit和Sierra紧随其后,其中Summit峰值达到200 PFlops,Linpack性能为历史首次突破百P达到143 PFlops,Sierra仅以微弱优势超越神威太湖之光获得季军,神威太湖之光位居第四名。
(2)进入2020年11月份,世界TOP500机器的Linpack性能都超过了1319 TFlops;进入2020年,中国TOP100机器的Linpack性能都超过了1869 TFlops,中国排行榜的上榜门槛再次超过世界TOP500。中国TOP100中有98个系统是机群,机群体系架构的数量继续保持绝对数量优势。其中采用异构加速体系架构的机器数量达到了39套,且由过去的集中在前几名和比较大的机器,变为分散在TOP100中,这样的变化表明随着深度学习等大数据应用的普及,GPU加速的异构体系结构获得了更广泛的应用。
(3)世界TOP500中TOP 10的最低性能都超过22PFlops;其中Dell和IBM各制造2台,国家并行计算机工程中心、国防科大、日本富士通公司、Nvidia、Cray和Atos各1台。高端能力型超算(TOP10)的研制呈现出几家独大的局面,中美日欧都在积极占领制高点,且都发布了2021年左右的E级超级计算机研制计划,抢占下一个制高点。中国TOP100中,TOP 10的最低性能大于2.96 PFlops,其中国防科大、神威、Dell公司和清华同方各1台,联想6台。
(4)世界TOP500上的459套系统使用Intel处理器,依然保持91.8%的高比例。采用异构加速体系架构的系统数量再次上升,从2019年的145套小幅上升到148套。中国TOP100的趋势与TOP500一致,2020年有39套系统采用了GPU/MIC加速,与2019年的27套相比有所增加,其中主要归因于深度学习算法在互联网公司的成功应用,使得CPU+GPU的异构加速集群成为当前互联网公司进行AI训练的首选体系架构。
(5)亚洲国家在世界TOP500上的机器数量继续保持较高占比,从去年的274台降为267台。排行榜中有来自中国大陆的213套系统,总数排世界第一。虽然中国上榜的数量排名世界第一,但我们应该清醒地认识到,其中大部分的机器并非应用在传统的科学计算应用,而是新兴的互联网云计算和大数据应用。
(6)目前中国TOP100排行榜中机器的平均Linpack性能3.84 PFlops,是2019年3.47 PFlops的1.10倍。2020年国际TOP500排行榜中机器的平均Linpack性能为4.86 PFlops,是2019年3.29PFlops的1.47倍,增速较去年大幅增加,主要原因在于排名第一的机器对平均性能的影响很大。国内和国际排行榜的平均性能双双首次超过3.8 PFlops。我国发布的神威太湖之光和天河二号两台超级计算机的Linpack性能就占到了中国TOP100的总性能的40%!
如何用好神威太湖之光和天河二号,发挥其巨大的计算能力,做好中国的超级计算应用软件和应用,成为未来2~3年中国超级计算行业面临的挑战性问题。
2
制造商分析
2.1
我们在图2中给出了中国TOP100制造商的上榜机器数量份额图。
图2中国TOP100制造商机器数量份额图(2020.11)
Fig.2 Vendors system share(2020.11)
中国TOP100上的超级计算系统出现了新面孔,Dell公司的一台机器上榜,打破了榜单连续两年全为国产超算系统的记录,但国产超算在国内市场依然占据绝对主导地位。2020年中国TOP100排行榜上厂商的上榜机器数量份额与去年类似,国产机器的市场份额主要被联想、浪潮和曙光三家瓜分,联想今年以35台机器获得份额第一名,浪潮以32台位列第二,曙光22台获得第三。
图3给出的是从2002年到2020年中国TOP100国内外厂商系统份额的趋势变化情况。
图3 中国TOP100国内外厂商系统份额趋势(2002–2020)
Fig.3 Trend of the vendors system share(2002 – 2020)
从装机数量上,前三名分别是联想(35%)、浪潮(32%)和曙光(22%)。华为公司作为HPC厂商继续出现在2020年的TOP100 上,并继续占据2%的份额。今年新增三家公司,Dell公司研制的一台机器位列TOP 100第三名,清华同方研制的一台机器位列第四名,联泰集群研制的一台机器位列第72名。联想、浪潮和曙光公司虽夺得机器总数量的前三名,且总数量占比达89台,但其机器总性能与神威和国防科大的机器性能总和相当,说明其机器规模仍然属于中小规模。联想公司通过对IBM公司X86 HPC产品线的并购,第七次在机器数量份额上取得冠军,但是如何保持良好的发展势头并持续大力投入,是联想公司需要解决的问题。
目前的中国超算市场基本形成了联想、浪潮和曙光三足鼎立的格局,且占据90%左右的份额,今年国外厂商在HPC领域又重新返回中国市场,未来如何发展值得关注。国产厂商在逐渐获得国内市场的垄断优势之后,开始纷纷布局国际市场,开启国际化的征程,其中的华为和联想公司,因为本身公司已经是跨国公司,具备先发优势。而浪潮公司和曙光公司2018年在国际市场也开始有所斩获,传出好消息。从TOP500数据看,我国以213台数量远超第二名美国的113台。联想制造的超算系统达到181台,位列厂商第一,浪潮和曙光分别以66台和51台位列二三名,三家厂商占据298台超过一半,出口85台,这充分说明了我国超算发展已经牢牢占据领先地位,超级计算系统会成为中国继高铁之后,另外一个可以出口的中国制造高科技产品。
3行业领域分析
为便于分析,我们在图4给出了2020年中国TOP100中的行业应用领域系统数量份额图。
图4 中国TOP100行业应用领域机器系统份额图(2020.11)
Fig.4 Area system share(2020.11)
从2020年11月发布的中国TOP100的行业应用领域来看,2020年国内高性能计算主要分布在互联网、云计算、大数据、金融、科学计算、超算中心和视频七个领域。云计算占比17%继续保持份额排名第一的领域,这与中国互联网公司的云计算应用快速崛起和大数据中的深度学习算法的广泛应用有很大关系。大数据较之去年的14%略微上升为15%,互联网公司通过深度学习算法重新发现了超级计算机特别是GPU加速的异构超级计算机的价值,纷纷投入巨资建设新系统。
国内的几大主要应用领域是互联网、大数据、深度学习、云计算、科学计算和超算中心等。国内最为突出的特点是互联网服务云计算和大数据应用,特别是深度学习应用异军突起,两者的份额之和超过30%,虽然较之去年的48%有所下降,但占比仍为最大。
综合来看,目前的互联网大数据/深度学习、互联网服务/云计算、科学计算、超算中心等领域是高性能计算的主要用户。互联网大数据特别是AI领域增长强劲。
根据历年积累的数据,我们在图5中给出了中国TOP100从2002年到2020年的应用领域趋势图。
图 5中国TOP100应用领域趋势(2002–2020)
Fig.5 Trend of area system share (2002 – 2020)
4展望
综合从2002年开始的中国大陆高性能计算机TOP100排行榜的第一名Linpack性能、第一名峰值性能和总性能,我们得到了图1中的中国高性能计算机性能发展趋势图(2002-2020)。
从图中的数据可以看出,中国高性能计算机的研制和生产也是有一定规律的。我们可以看到,从2002年到2005年,中国超算的发展经历了一次快速发展期,这个发展期维持到2005年(4年),然后在2005年开始进入一个平稳发展期。而2007年排行榜第一名性能的小幅增长,是一个信号,说明大陆地区开始走出平稳发展期,进入新一轮快速发展期。2008年百万亿次机器的出现,证实了我们的观察。2009年千万亿次天河一号的提前横空出世,颠覆了我们之前的2010年底或2011年初发布峰值千万亿次国产机器的预言。2010年11月,天河一号A登顶世界TOP500 第一名,作为这个从2008年开始的超算发展活跃期的一个休止符。直到2012年天河一号A再夺国内TOP100第一,标志着我国超算的研制仍然维持在平稳发展期,这个周期在2013年被天河二号的出现结束。2013年6月,天河二号帮助中国再夺世界第一且连续六次蝉联世界第一和连续三次蝉联中国TOP100第一,说明中国超算发展在短暂进入活跃期后,再次进入平稳发展期。这个平稳发展期本来应该在2015年结束,但是由于限售时间的影响,而推迟到2016年结束。果然,中国超算在2016年以超算排行榜连续第八次夺取冠军、首次获得总数量第一名且总性能几乎与美国持平、国产超算应用在国产神威太湖之光超级计算机获得戈登贝尔奖和中国科技大学大学生团队在美国SC大会比赛获得单项和总冠军等最强音,将2016年定格为中国超算的大满贯年。2017年开始,中国超算再次不可避免地进入一个新的平稳发展期,没有新的大机器发布,三家超算研制单位在获得科技部的资助后专心研制新的E级超级计算机。2018年,三台E级原型机均已部署到位,将正式决定哪几家获得最后的E级系统的研制资格。新的快速发展期将最早在2020年重新启动。与此同时,美国的超级计算机将迎来一轮活跃期,美国的几台100PFlops超级计算机将陆续发布,为美国重新夺回世界第一的位置。2020年,日本的Fugaku机器获得冠军,峰值超过500PFlops,Linpack性能达到422PFlops。
从第一名的峰值性能趋势预测可以看出,根据新收集的数据,可以得到的新预测结果是:峰值Exaflops的机器将在2021年~2022年间出现[8-10]。
综上,2020年中国TOP100排行榜的主要亮点如下:
(1)神威太湖之光继续蝉联中国TOP100第一名;
(2)联想位列中国TOP100数量份额第一名;
(3)TOP100总体性能接近384PFlops,中国高性能计算市场的增速继续降低;
(4)TOP100平均性能突破3.8PFlops,落后于国际Top500平均水平;
(5)入门系统性能门槛继续提升,达到1869TFlops,再次大幅度超过国际TOP500的入门系统性能1319TFlops;
(6)98套系统采用机群结构,计算机体系结构创新形势依然严峻;
(7)上榜高性能计算机制造商为9家,国产率99%,市场份额进一步集中在联想、浪潮和曙光三家厂商,占据89%的数量份额;
(8)应用领域新增短视频,高性能计算应用特别是在大数据和云计算领域呈现快速发展的局面。大数据、超算中心、互联网服务/云计算和网络安全等是高性能计算主要用户。
展望2021年,各国E级计算机计划的发展是2021年值得关注的大事。我国三套E级原型系统的研制均已顺利完成,最后的E级系统研制任务何时完成值得关注。随着美国E级超级计算机系统研制计划的提前和中国E级超级计算系统研制计划的可能延后,中美两个超级计算大国之间,谁能在2021年夺取世界第一的位置,充满了变数。
利益冲突声明
所有作者声明不存在利益冲突关系。
参考文献
[1]Hans Meuer, Horst Simon, E. Strohmaier,Jack Dongarra. TOP500 Supercomputer Sites[OL].http://www.top500.org.
[2]Antoine Petitet, Clint Whaley, Jack Dongarra, Andy Cleary.HPL Benchmark 2.0[OL]. http://netlib.org/benchmark/hpl/.
[3]张云泉,孙家昶,袁国兴,张林波.2019中国高性能计算机TOP100排行榜[OL]. http://www.hpc100.cn.
[4]张云泉,孙家昶,袁国兴,张林波.2018中国高性能计算机TOP100排行榜[OL].http://www.hpc100.cn.
[5]张云泉,孙家昶,袁国兴,张林波.2017中国高性能计算机TOP100排行榜[OL].http://www.hpc100.cn.
[6]张云泉,孙家昶,袁国兴,张林波.2016中国高性能计算机TOP100排行榜[OL].http://www.hpc100.cn.
[7]张云泉,孙家昶,袁国兴,张林波.2015中国高性能计算机TOP100排行榜[OL]. http://www.hpc100.cn.
[8]Jack Dongarra.An Overview of High Performance Computing and Challenges for the Future[OL].San Diego, CA, USA: SIAM.[2008-07-07].http://www.netlib.org/utk/people/JackDongarra/SLIDES/siam-0708.pdf .
[9]Yunquan Zhang, Jiachang Sun, Guoxing Yuan and Linbo Zhang. A Brief Introduction to China HPC TOP100: from 2002 to 2006[C].Workshop on High Performance Computing in China: Solution Approaches to Impediments for High Performance Computing, Supercomputing 2007,10-16,Nov.,2007,Reno,NV,USA,32-36.
[10]Zhang Yunquan,Sun Jiachang,Yuan Guoxing, and Zhang Linbo. Perspectives of China’s HPC system development: a view from the 2009 China HPC TOP100 list[J]. China: Frontiers of Computer Science in China, 2010 : 437-444.
收稿日期:2020年11月23日
张云泉,中国科学院计算技术研究所,计算机体系结构国家重点实验室,博士,研究员,博士生导师,主要研究领域为并行算法与并行软件。
本文承担工作为:论文整体架构和布局,论文撰写。
袁良,助理研究员,主要研究方向为并行计算模型、并行算法设计与程序优化。
本文承担工作为:论文数据整理和分析。
袁国兴,北京应用物理与计算数学研究所,研究员,研究方向为大规模科学与工程计算的方法与软件。
本文承担工作为:论文布局。
李希代,中国计算机学会高性能计算专委会,助理秘书长。
本文承担工作为:数据收集与整理。
【主编视野】钱德沛:构建支撑科技创新的新一代计算基础设施命
热点|还没了解区块链?一文带你看懂区块链
一线|白春礼:科技创新的主要发展趋势和重点突破方向
《数据与计算发展前沿》人工智能专刊预告
智能时代 算力赋能|《数据与计算发展前沿》首届中国超级算力大会特刊
《数据与计算发展前沿》(CN10-1649/TP,中英文双月刊)是由中国科学院主管、中国科学院计算机网络信息中心主办的学术性专业期刊。期刊旨在以开放、创新的前瞻姿态,聚焦数据、计算与网络的发展态势与技术前沿,推广原创技术方案、创新成果与最佳实践,促进学术交流,推动自然科学、社会科学以及各技术领域与先进信息技术的广泛交叉与深度融合,提高我国在该领域的科研应用水平。