游客 欢迎您   登录 | 注册 | 付款方式 | 备案中心 | 代理合作 欢迎来到宽捷数据(齐鲁主机)

您的位置: 网站首页服务器租用常见问题 》高性能计算集群是主流 刀片是趋势
高性能计算集群是主流 刀片是趋势
发布时间:2007-7-28

 集群成为高性能计算应用主流

  目前,高性能计算机的主流体系结构收缩成了三种,即SM、CC-NUMA、Cluster。在产品上,只有两类产品具有竞争力:一是高性能共享存储系统,如IBM690、Sun Enterprise15000、SGI Origin3800;二是工业标准集群,包括以IA架构标准服务器为节点的PC集群和以RISC SMP标准服务器为节点的RISC集群。当前,高性能计算机产业中工业标准集群越来越显示出优势,这也反映了标准化在信息产业中的巨大杀伤力。工业标准集群采用量产的标准化部件构成高性能计算机系统,极大地提高了性能价格比,从科学计算开始逐渐应用到各个领域。

  其中,推动这一趋势形成的三个核心技术是Intel Xeon处理器、Linux操作系统和Myrinet互联网络。现在,搭建集群已变得轻而易举。各种指导搭建集群的书籍很多,在一些大学里,老师和学生按照这些指导书籍,就能搭建起试验用的集群系统。高性能计算集群是一种由标准的软硬件计算机组件架设起来的大规模计算集群系统。虽然其成本只有超级计算机的10%,但其性能却接近甚至优于传统的超级计算机。不仅如此,高性能计算机集群还拥有极强的灵活性和可扩展性。

  在2006年TOP500中,最常用的体系结构仍为集群系统,高达359台,占系统总数的72%。2006年的中国TOP100排行榜显示,超过70%的系统都采用了集群体系结构。值得关注的是,有26套是刀片服务器集群系统,其中HP和IBM分别占有13套和11套。在这26套系统中,有17套用于石油勘探,6套用于网络游戏。由此可见,采用刀片服务器搭建集群将是国内HPC应用的一大趋势。在2007年TOP500中,HP大部分服务器都采用集群体系结构。

  微软认为,开放化、标准化已经成为IT技术应用的必然趋势,很多企业用户在搭建信息化平台之初选择了具有很好性价比、基于x86的工业标准服务器。工业标准服务器在IT基础架构、Web应用、邮件服务器及协同方面,表现出很大市场潜力。随着Windows Server 2003 R2的推出,微软也希望能够吸引更多用户转向Windows平台,帮助他们搭建“稳如磐石,多快好省”更胜一筹的现代企业信息基础架构。

  惠普称,和传统的高性能计算机技术相比,集群技术可以利用普通的PC、工作站、服务器作为节点,系统造价低;可以实现很高的运算速度,完成大运算量的计算;而且提高了系统的可用性和可扩展性;具有较高的响应能力,能够满足当今日益增长的信息服务的需求。

  体系标准化亟待确立

  计算机集群的特点是它要将上百、上千,甚至是上万台电脑集成在一起,在同一时间内共同完成一项任务。面对这种情况,某些专家指出,一些在单机运算上看似不起眼的问题,在计算机集群方面会被凸现出来,例如散热、能耗以及整机的稳定性。

  目前HPCC单个计算节点的耗能在300瓦到400瓦之间,如果一个拥有上千、上万个节点的高性能计算集群,它所消耗的能量将与一个小型发电站所产生的电能相当。这种能源上的消耗,不容忽视。随着能耗的上升,散热问题同样令人堪忧,毕竟高密度的集群方式,需要的散热条件非常严格,一旦散热出现问题,直接影响整个计算机集群的稳定性。

  此外,专家还认为高性能计算集群技术的构架是以IA架构为基础。Intel IA架构本身是从PC电脑发展起来的,因此它的稳定性与传统Unix服务器或是超级计算机相比,不是在同一个数量级上进行比较,IA架构的稳定性要低得很多。节点上千,故障一旦发生如何迅速处理也是一个难题。

  对此,惠普称,目前,计算机集群在稳定性、散热和功耗上取得了很大提升,完全能满足用户的需求。

  曙光公司认为,在产品技术上,集群经过十多年的发展,已经非常成熟了,但技术的标准化还存在问题,市场上甚至出现一些简单地把PC服务器放进机柜来冒充的“伪集群”,明显缺少集群的基本特性,既以低价扰乱了市场,又给用户的应用带来了隐患。为此,曙光推出了基于集群服务器的十大标准化技术,作为集群服务器的领导厂商,曙光有责任倡导出业界标准,为用户在市场上采购集群产品提供借鉴。

  浪潮则称,事实上,目前中国集群发展进入了一个瓶颈期,多数稍具技术实力的厂商都可以设计出计算速度上万亿次的高性能计算机。可以说,在充足的资金前提下,设计一套全球前十名的高性能集群系统,并非难事。在科学计算方面,唯一的问题因素是资金。此外,在体系结构层面,目前全球业界还没有出现重大的突破。就目前业界技术发展状况而言,浪潮基于弹性部署理念的计算能力、数据通讯、输入输出非单极优化的MABS体系结构思路,为高性能商用服务器系统实现技术突破奠定了理论基础。

  通过采访,记者了解到,IA架构的计算机集群以前存在的诸如散热、稳定性、功耗等矛盾,在厂商的层面已经基本解决,与以往的解决方案相比,集群在成本、性能上的强势远大于一些专家所指出的劣势。在未来,体系架构和标准化应是厂商们努力的目标。

  刀片、多核HPC的未来发展方向

  国家在“十一五”期间提出了建设节约型社会的发展方针,随着高性能计算在国内的日益普及,高性能计算机(HPC)的节能和节约空间和其他一些在国外已经备受关注的问题目前在国内也逐渐受到了用户的广泛关注。

  一些HPC的用户特别是超大规模和大规模HPC的用户已经把能耗(每瓦特计算性能 Flops/W)和占地面积(每平方米计算性能Flops/m2)作为HPC的重要指标在产品选择过程中予以和峰值、效率等传统评价指标一样的关注。这也使得HPC厂家把减少能耗和占地面积的节约型HPC作为产品的重要发展方向来研究。

  理论上来说,HPC体系结构的创新才是真正解决HPC能耗的根本方法和途径。IBM公司推出的蓝色基因通过体系结构的创新把每瓦特计算性能、每平方米计算性能提升到了一个新的高度,大大超越了其他体系结构的HPC。

  但同时也要看到,HPC体系结构的创新是一个长期的过程,新的体系结构的计算机从推出到推广到成熟也是一个长期的过程。以蓝色基因为例子,其从研发到产品形成花去了IBM公司近10年的时间,目前因为其对操作系统和应用软件的有限支持,离大规模普及仍然有一段不小距离,甚至能否大规模普及还是一个问题。所以我们更多的应该立足于现实来谈论目前占HPC主流的集群,这更符合目前广大用户的需求。因为这些用户在相当长一段时间内会继续选择集群产品和对现有设备进行改造已达到节约型高性能计算的要求,而且这个要求十分的迫切。

  以曙光为例,曙光高性能计算机用户最大的目前达到了10000个节点,能耗3000kw,占地面积也十分惊人。以另外一个用户中石油BGP为例子,目前其共拥有曙光集群近2000节点,净能耗600kw,净占地面积接近300平方米,加上存储、交换设备和空调等其他配套设施,每年电费近1000万元。这个电费对一个企业来说是一笔不小的费用,但对这个有1万颗处理器计划的用户来说,最致命的是要为未来两年的3000个节点加盖高规格HPC机房,这是难以承受的费用。目前解决这个问题的两个途径是刀片(Blade)与双(多)核处理器(Multi-core Processor)。

  不过,值得一提的是,由于目前刀片、双核和集群对很多用户来说都是最新的产品和技术,之间又存在各种关联关系,加上各个HPC厂家的片面宣传某些产品特性,有些用户把这些技术对立起来看待,这是一个误区。很多用户存在一些疑问:买集群还是买刀片?买刀片还是买双核?这些看起来不应该有关系的问题在目前看起来都成了合理的。而这并不利于刀片和双核在节约型HPC中的普及应用。

  其实,集群是一个高性能计算机的体系结构,由众多的节点机通过网络连接构成,刀片是集群(一组)节点机的一种表现形式。由于很多小型HPC用户理解中的集群长期是由机架式服务器构成,而刀片系统(Blade System)又可以包含多个刀片,所以造成了这种产品对立。事实上对于大规模HPC用户来说,由于单独的刀片系统不能满足其要求,刀片和集群两者得到了统一,其购买的是由刀片节点机构成的集群系统,所有的集群系统软件都适用于这个系统。片面强调刀片与集群对立的厂家,大部分都是因为其没有完善的集群系统软件而回避刀片集群这种提法,从而回避对这种多个刀片系统构成的集群的管理、监控、调度等众多单一系统映像(Single System Image)的要求,实际损害了用户的利益,也是造成国内许多大规模刀片集群系统难以使用的首要原因。

  可见,尽管我们认识到刀片和双核是解决HPC能耗问题的现实可行办法。但由于人们混淆了刀片、双核与集群之间的关系,使得用户在通过刀片和多核技术来降低HPC能耗这一问题上,面临了一些认知上的障碍。相信一旦市场理清了这些其实并不复杂的关系,双核与刀片在HPC领域会有更大的作为。

  相关链接

  HPC应用领域变迁

  - HPC新应用领域

  ● 半导体工业:源于单芯片集成度的数量级提高所带来的复杂布线计算需求。

  ● 信息处理:源于海量数据的积累和数据业务的发展。

  ● 数据库应用:数据库技术的成熟和数据业务的发展,数据挖掘技术的业务化。

  ● 金融业务:源于数字化管理的需要。

  ● 电信业务:源于电信业务的快速发展。

  - 从Top 500消失的领域

  ● 化学领域:对计算的需求低于计算能力的增长。

  ● 电力领域:对计算的需求低于计算能力的增长。

  ● 空间技术领域:对计算的需求低于计算能力的增长。

  - 未来HPC应用更值得关注的领域为:

  ● 数据挖掘应用;

  ● 图像处理业务;

  ● 基因测序比对处理。

  ● 图像处理业务;

  ● 基因测序比对处理。

Copyright @ 2005-2015 LEON 宽捷数据(齐鲁主机) All Rights Reserved   济南雷欧网络科技有限公司

办公地址:济南市天桥区天成路世茂天悦广场2座1635室    机房地址:济南市天桥区天桥东街26号天东商务中心四层(全部)

《增值电信业务经营许可证》ISP证编号:鲁B2-20100021号    ICP证编号:鲁B2-20100021号    互联网协会会员单位

宽捷数据-QQ客服专员
咨询热线
0531-85916435
13791116435
18615239818
域名空间客服
销售客服 在线点击直接联我
云主机、VPS客服
销售客服 在线点击直接联我
服务器托管租用客服
售后、技术客服
技术客服 在线点击直接联我
备案专员 在线点击直接联我
微信客服-扫码
扫码加好友