超级计算机技术及其应用

这一次,我的单元是在东主楼的“超级计算机技术及其应用”。

首先,是由实验室的一位同学带领我们参观一个超级计算机的机房。十分惭愧,作为计算机科学与技术系的学生,我居然到这节课之前都没有认真参观过一次超级计算机。超级计算机的机房中有很多标准机架,每个机架中插了很多高性能的计算机,它们通过以太网或者InfiniBand等特殊的互联网络连接起来,从而组成超级计算机。机房的一大特点就是冷,特别冷。这是为了防止计算机过热而缩短寿命甚至损坏。

参观结束,回到温暖的会议室,老师开始为我们介绍具体内容。老师说,超级计算机是相对的概念。例如,在上个世纪,ENIAC性能为每秒5000次加法,与那时其他的机械计算机相比而言很快,自然就被称为超级计算机。当然,现在的桌面计算机的性能远高于ENIAC,但是也不被称为超级计算机,因为目前的超级计算机还要更快。

超级计算机的作用包括弹道计算、核爆模拟、地质勘探以及天气预报等。为了鼓励超级计算机的应用,ACM设立了Gordon Bell奖,是超级计算应用的奖。

下面以天气预报为例,说明超级计算机的重要之处。天气预报的大致原理是将地球分为小格子,每个格子有自己的(相对于时间的)参数,把每个小格子的参数联立方程,就可以求解未来的情况了。由于小格子个数很多,并且每个小格子的参数很多,因此需要超级计算机来支持。随着超级计算机性能提高,小格子的粒度可以变小,数值迭代算法获得的数值解精度也会越高,因此,最终表现为天气预报的准确度提高。

计算机性能衡量的指标包括存储能力以及计算能力。存储能力的单位是为人所熟知的字节(byte)。计算能力则使用每秒执行的浮点数操作(基础运算,如加法或乘法等)次数来表示,缩写为flops。桌面计算机的计算能力大约在Gflops,目前的超级计算机的计算能力约为几百Pflops,下一代超级计算机期望达到Eflops。

目前的超级计算机可能包括这样几个部分。显然,处理器是一个部分,超级计算机中主要使用高端的企业级处理器。由于企业级处理器核心数目较多,为了设计上的方便以及优化整体性能,核心频率不像桌面级处理器那样高。企业级处理器的价格与普通桌面级处理器相比会高很多,例如桌面级的处理器仅需几百元,但企业级处理器需要几万元一块。此外,在现在,GPU也是一个必要的部分。GPU相对于通用处理器的区别在于,它的一个控制单元可以控制很多运算单元。对于目前火热的深度学习所需要的运算,GPU刚好可以满足这样的需求。为了将分离的计算机连接起来组成超级计算机,网络也很重要。目前使用的千兆网延迟大约百微秒,万兆网几十微秒,而InfiniBand延迟只有不到一微秒。此外,在软件方面,由于超级计算机的硬盘容量大,但是接口带宽小,于是需要并行文件系统等软件支持。

为了评价世界上超级计算机的整体性能,鼓励超级计算机的研究,有一个超级计算机的排行榜,叫做TOP 500,在每年的6月和11月发布更新。同时,还有几个世界顶级的超算比赛,包括ASC、ISC和SC。老师说,比赛的唯一的限制是,选手搭建的超级计算机的总功耗不超过3kW。老师提醒我们,3kW的功耗事实上不是很大,大约就是三个电吹风消耗的功率。老师说,刚刚那位带我们参观超级计算机机房的同学,就是某次比赛冠军队伍的成员之一。当然,这仅仅是比赛用的超级计算机的功耗,实际的超级计算机的功耗大约为十几MW(1MW=1000kW)。

最后,老师讲了讲当前的热门话题,结束了今天的课程。

发表评论

注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

:wink: :twisted: :roll: :oops: :mrgreen: :lol: :idea: :evil: :cry: :arrow: :?: :-| :-x :-o :-P :-D :-? :) :( :!: 8-O 8)

本文链接:https://twd2.me/archives/11204QrCode