- 最后登录
- 2007-4-10
- 注册时间
- 2003-11-27
- 帖子
- 2573
- 精华
- 0
- 积分
- 65442
- 阅读权限
- 90
|
这里有一篇文章。
转自 http://pc.zol.com.cn/2003/0924/71829.shtml
高性能计算机的评价(上)
类型:转载 作者:IBM 互联网服务器部 么石磊 日期:2003-09-24 14:26:49
--------------------------------------------------------------------------------
上世纪90年代以来,以高性能计算机为基础的计算科学得到了长足的发展,它与理论科学和实验科学相辅相成、彼此印证,成为人类科学研究必不可少的方法之一。在许多工业领域,如汽车、航空航天器的设计制造,石油勘探、地震资料处理及国防(核爆炸模拟)等,科学计算已经成为首选研究方法。在教育、科研领域,高性能计算有着更广泛的施展空间,在生命科学、材料设计、气象气候研究等学科中已成为科学研究的必备工具。与国际高性能计算机的使用相比,中国的高性能计算的工业应用程度不高,其中以石油勘探/地震资料处理最为成功(但现在越来越多的ISV支持PC Cluster,使高端市场受到很大冲击)。目前中国的高性能计算市场更多地集中在教育(高校)和科研(中科院、气象单位等)领域。同时,不可忽视的是网格计算的市场。据中科院专家介绍,我国从2003年开始的3~5年中,将在全国范围内建立教育网格和国家网格两大网格系统。教育网格俗称“百校网格”,就是在全国范围内选择100所重点高等院校建立网格节点,用CERnet连接起来,实现网格计算。每个教育网格节点(即高校)都会有购买高性能计算机的需求。与此同时,国家网格也在筹划建设中。 其中一个方案是按地区划分,在全国建立8个大节点(计算中心),然后向周边地区辐射。目前,北京(华北)和上海(华东)两个大节点已经在筹划建设中。另一种方案是按省份划分,那样就有30多个网格节点。
随着对高性能计算需求的增加,面对众多的高性能计算机产品,如何选择适合自己的计算机系统成为用户面对的重要问题。本文将从几个方面对科学计算领域中高性能计算机的评价进行初步的探讨。
一、 CPU、主频、峰值速度及TOP500排名
CPU作为计算机的核心部件一直被给予最大的关注。现在标量处理器通常可分为三类:复杂指令集CISC(代表为Intel Pentium, Xeon),精简指令集RISC(代表为IBM Power, HP PA-RISC, Compaq Alpha, SUN Ultra-SPARC, SGI MIPS)及显式并行指令集EPIC(代表为Intel IA-64)。CISC为程序员提供了丰富的指令集(200条以上),所以对编译器的设计要求不高,可以用较为简单的编译器系统去生成CISC执行程序。但是复杂的指令系统存在芯片设计复杂、功能部件少,耗电量大等缺点。根据对大量实际应用程序的统计,常用的指令就只有十几条,这也是RISC芯片的设计基础。RISC芯片中通常集成了较多的功能部件,利用强大的编译系统使多个功能部件并行执行,并采用流水线(pipeline)、指令乱序(out-order)等设计使CPU的性能得以充分发挥。目前RISC芯片是高性能计算机的主流芯片,其中以IBM的Power处理器最为成功,并有长期、持续的发展计划。而其他厂商(如HP和SGI)正逐渐放弃对RISC芯片的发展,转向EPIC类型的Intel Itanium产品。与RISC芯片相似,EPIC芯片结构的设计目标也是指令的并行化,以获得最优的性能。但是与RISC芯片不同,EPIC芯片由编译器去决定如何将指令并行化,以何种方式、何种顺序执行指令,然后交给硬件去执行。而RISC系统则直接将指令交给硬件,由硬件去决定如何做并行、如何做Pipeline。所以两种指令系统存在本质的差别,我们不能期望一个具体的应用程序不经过优化、再编译就能在两种系统上获得同样高的性能。所以HP要将PA-RISC和Alpha上的应用移植到Intel Itanium2上,并获得同样高的性能将是一项非常艰巨的任务。同时,与RISC相比较,EPIC性能的发挥更依赖于编译器的设计,而Intel一直以CISC芯片为主要产品(如前所述,CISC芯片对编译器的要求最低),在编译器的开发上经验不足。虽然与HP进行合作开发,但其编译器的表现仍有很大的提升空间。有经验表明,当同样的应用程序分别在HP-UX,Linux系统下编译,同样运行在Itanium2的系统上时,在HP-UX下的性能要优于Linux的性能。当对同样采用Intel Itanium2的HP rx5670和SGI的Altix进行比较时,HP产品的性能也会好于SGI的产品,这也应归功于编译器的表现。
经常与CPU同时被提及的就是它的主频。很长时间以来,主频以其直观的数据特点成为计算机用户判断CPU性能的指标。但主频只有在同种类型的CPU中比较才具备一定的参考价值。
总的来讲,单纯从CPU的角度选择系统要考虑以下几点:
1. 该CPU是否有长远、持续的发展计划;
2. 该CPU在同类处理器中的地位如何;
3. 编译系统及相应的开发环境;
4. 用户的具体应用是针对哪种类型的指令系统上开发的,因为只有该指令系统才能充分发挥处理器的性能;
5. 如果要将应用运行在新的CPU上,程序移植的工作量如何,是否有ISV愿意或已经做了相应的移植工作。
另外一个经常被用来评价计算机性能的简单指标是峰值速度。计算机的峰值速度通常是指其理论峰值速度,其计算公式是:
理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目/108
其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。以IBM POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为1.7G*2*2=6.8Gflop/s,或68亿次/秒。对于满配置的IBM p690来说,该系统的峰值速度就是1.7G*2*2*32=217.6Gflops,或2176亿次/秒。不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:
峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。
世界计算机TOP500排名就是以LINPACK的测试结果为基础的。TOP500不仅仅是一个全球最快的前500台计算机的排名,实际上它可以看成一个数据库,因为它提供了除运算能力外的其它丰富的信息。如计算机厂商可以通过排名的情况分析高性能计算机发展走势;用户可以从中了解本行业最高端计算机使用情况等。本文将就以下三个方面对2003年6月21日公布的第21届国际TOP500排名进行简单的分析。
1) 按台数统计的分布:
本次排名中HPQ以上榜159台的成绩在台数上排名第一。IBM仅比HPQ少一台,以总数158台名列次席。SGI以54台排名第三。而SUN只有9台计算机上榜,最快的一台仅名列第212名,说明SUN已经逐渐退出了在高端市场上争夺。表一给出了几个主要计算机厂商在排名中的具体分布情况(其中Japan一项为日本的NEC,HITACHI和FUJITSU公司生产的计算机的和)。
从表中可以看出,在前50名中IBM占据26个位置,超过半数;前150名中IBM有74台,占总数的49.3%。而HPQ在前150名中只有13个名额,只占8.7%;更多的HPQ系统集中在201—500名之间,共有128台。由此可以看出两个公司虽然在总数上相差无几,但IBM在大型系统上占有明显的优势。 |
|