首页 »

我国E级计算机2020年左右发布,比最快计算机高出一个数量级

2019/10/10 1:43:07

我国E级计算机2020年左右发布,比最快计算机高出一个数量级

我国高性能计算领军企业中科曙光前天在第29届国际超算大会上,发布了由其牵头的E级计算系统研发路线图。这是中国E级计算系统研发路线图首次亮相国际舞台。E级计算是指运算速度在每秒百亿亿次(1018/秒, Eflops)量级的计算机,它比目前最快的计算机性能还要高出一个数量级以上。为何要研发E级计算机,它将给我们的生活带来什么变化?解放日报·上观新闻记者就此专访了中科曙光高性能产品事业部总经理曹振南。

 

解放日报·上观新闻前有天河二号,后有神威太湖之光,如今E级计算机原型系统已经启动。为何要研发比目前最快的计算机性能还要高出一个数量级以上的计算机?

 

曹振南:E级计算这个目标的确立既是计算发展的必然结果,更是人类对计算提出的必然要求。一方面很多研究和探索只能通过计算方法来开展,如模拟气候和天体物理学复杂的过程。另一方面,越来越多的实验和观测系统发现,产生的数据超过Peta字节且迅速地迈向E级字节。对这些数据进行处理和分析的需求直接提升了所需的计算能力的标杆。

 

E级计算机是世界各国特别是发达国家竞相争夺的技术制高点,美国、欧洲、日本等国家和地区都提出了自己的E级超算研发计划。2008年到2011年,美国能源署和美国国家研究委员会委员多次对E级计算的科学必要性进行了阐述和汇总。他们着重对气候、高能物理、核物理、聚变能科学、核能源、生物学、材料科学、化学和国家核安全9个方面进行了调研。同时,美国国家科学基金会对数十个遍及科学和工程的E级应用的研发团队进行资助。比如,海平面上升及其与全球变暖之间的关系;暗物质的质量;伽马射线爆发的本质等。这些模拟计算需要在原子尺度上进行,都是重要的E级计算需求。

 

对于中国来说,解决发展面临的重大挑战性问题,很多都需要高性能计算的支持。比如,在防治环境污染方面,受到计算能力与软件限制,目前仍处于使用理想模型、对单个生活小区进行分析的级别。高性能计算将在阐明大气复合污染的成因,预测大气复合污染物扩散和追溯污染源等方面发挥重要作用。此外,为解决列车在高速行驶时出现的横风效应、会车效应、隧道效应及气动噪声等一系列空气动力学问题,也需要使用基于高性能计算的数值风洞开展研究。

 

解放日报·上观新闻:为什么说E级计算机除了追求更快的计算速度,还面临着“功耗墙”“可靠性墙”“编程墙”等几方面的挑战?

 

曹振南:E级计算机的计算性能将达到每秒百亿亿次量级,要实现如此之高的性能,同时又要具有很高的效率、可靠性,且功耗不能太高。这是非常具有挑战性的工作。

 

就拿能效比来说吧,E级计算机是一个普通计算机性能的10的9次方倍,功耗只有普通计算机的10的5次方倍。这样高的性能功耗比,目前市场上没有一款处理器可以满足。中国着力发展自己的处理器已经数十个年头,性能尚未完全赶上世界先进水平,要在这短短几年把处理器的性能提高几个数量级,这必然是全球IT人士面临的巨大挑战。

 

在可靠性方面,以神威·太湖之光超级计算机为例,它是由40个运算机柜和8个网络机柜组成。一台机柜就有1024个处理器,整台计算机共有40960个处理器。对于这样一台复杂精密的设备,要保证各个层次部件的稳定性与可靠性,难度可想而知。而E级计算机的计算性能将是太湖之光的10倍以上,其稳定性与可靠性的难度必然是指数级增加。

 

我特别想强调一下软件编程方面的挑战。超级计算的应用软件往往规模庞大,开发周期长、成本高、难度大,要真正发挥未来E级计算系统的能力,软件的开发任务会变得相当艰巨。目前的超级计算机系统尽管运行Linpack等基准程序可以取得70%以上的效率,但是执行实际应用程序效率低,往往在10%以下。解决E级计算应用效率与适用性的问题,需要开展应用与系统的深度协同设计,实现应用效能的大幅跃升。应用软件不仅需要在E级计算机上“跑”起来,更加需要具有良好的扩展性,真正发挥E级的计算效率,否则就成了“高速公路上跑拖拉机”。

 

解放日报·上观新闻:研发E级计算机,有哪些目标?计划用几年时间达到目标?

 

曹振南:按照我国科技部“十三五”规划来看,E级计算机的研制分为原型机和E级计算机2个主要步骤。通过原型机的研制,将会验证E级计算机系统的技术路线图,提出完整的E级系统方案。

 

原型机于2016年启动,2018年验收。预计E级计算机将在2020年左右对外发布。

 

解放日报·上观新闻:中科曙光、国防科技大学和江南计算技术研究所同时获批牵头E级高性能计算的原型系统研制项目,形成中国E级高性能计算“三头并进”的局面。作为唯一的一家企业,你们有何技术优势?

 

曹振南:作为亚洲第一大高性能计算机厂商,我们从2009年到2016年已连续8年蝉联中国高性能计算机排行榜市场份额第一。正在举行的29届国际超算大会公布了全球超算500强榜单,中国机器上榜总数达171套,与美国并列第一。其中,曙光上榜有47台,稳居全球前四。


题图来源:视觉中国  图片编辑:曹立媛