中国超级计算机
——突破技术封锁,模拟核试验必备设施
工程总投资:100亿元以上
工程期限:1975年——至今
2011年10月27日,我国第一台完全采用国产CPU处理器的千万亿次超级计算机——神威蓝光,在国家超级计算济南中心投入使用。该机装有8704片国产“申威1600”16核64位处理器,仅9个机柜便能达到峰值性能1100万亿次每秒。计算能力超过20万台普通笔记本电脑。系统综合水平处于当今世界先进行列。该系统具备扩充至每秒万万亿次潜力。
目前,中国已成为继美国之后第二个可以制造和应用千万亿次超级计算机的国家。在超级计算机领域,美国占绝对领先地位,中国、日本、欧盟、俄罗斯紧随其后,其他国家居于第三梯队。全球各国都在大力推进千万亿次计算机计划.比如美国能源部、DARPA、美国国家科学基金、美国国家安全局、欧盟EU-FP7计划、日本、法国以及我国的“十一五”计划,2010年前,曙光将推出千万亿次的曙光6000超级计算机,并大规模采用国产龙芯处理器。
世界第一台计算机
西蒙·克雷(Seymor Cray)博士与他研制的“克雷1号”亿次超级计算机。Cray 1超级计算机,是1977年前世界上功能最强大的计算机。
超级计算机的前世今生
1960年,刚成立三年的控制数据公司(CDC)接受美国原子能委员会的委托,涉足万难之险的巨型机领域。当时CDC公司的电脑总设计师就是年仅31岁的克雷,曾经是UNIVAC设计小组的成员。他是一位性格内向的“隐士”般人物,念念不忘的是建造心目中的巨型机,甚至想“隐退”回家去独自研究。CDC慷慨地满足了克雷的愿望,在距离总部80英里的密林深处为他建立了一个实验室。
克雷带领他的研究小组,远远避开“人世”。小组仅有34人,包括克雷本人在内,也只有2位博士。1963年8月,克雷终于从“密林”深处复出,把一台被他亲切称作“简单的蠢东西” —— CDC6600超级计算机公布于世。CDC6600是真正意义上的超级计算机,共安装了35万个晶体管,运算速度为300万次,是其他电脑的10倍。至1969年,克雷研制的CDC6600以及改进型CDC7600巨型机共售出150余台。
与比尔·盖茨这样精明的计算机商人不同,克雷是一个典型的工程师。曾经整整四个春秋,谢绝一切社交活动,埋头绘制图纸、制作零件。连著名的学术团体的颁奖,他也不愿抛头露面,为此博得了“丛林隐士”的绰号。克雷生平极少发表演说。
尽管克雷在上个世纪60年代成功开发了第一代超级计算机,但是真正将这个产品应用起来的还是前面提到的LawrenceLivermore国家实验室和另一位超级计算机设计者Frank McMahon,目的是为了克服当时磁芯存储器存在的延时问题。1971年前后Frank McMahon将这种想法成功地应用于CDCSTAR超级计算机的处理器CDC7600上。
接着,70年代中后期,以向量超级计算为主的超级计算机开始陆续出现,如CDC Cyber205和克雷1号。值得一提的是1975年诞生的“克雷1号”,实现了当时绝无仅有的超高速——可持续保持每秒1亿次运算。然而,这台超级计算机的体积却并不巨大,就像一套开口的沙发圈椅,靠背处立着12个一人高的“大衣橱”,占地不到7平方米,重量不超过5吨,共安装了约35万块集成电路。
从技术角度来看,克雷1号更加流行。这种机器具有8MB内存,但这种内存是晶体管存储器,而不是CDCSTAR-100使用的磁芯存储器。它还引入了向量寄存器的概念。
在整个70年代和80年代初期,向量计算处理对提高计算机运算速度十分有利,有利于流水线的充分利用,有利于多功能部件的充分利用。但由于时钟周期已接近物理极限,向量计算机的进一步发展已经不太可能。所以,要继续提高性能也就意味着必须投入多个CPU来同时为一个程序工作。在这样的背景下,一个全新的概念被提出来了,那就是大规模并行处理(MPP),也是从这个时候,英特尔、IBM和SGI开始成为超级计算机领域的新贵。超级计算机也开始走上了真正的商用化道路。
1992年,英特尔推出Paragon超级计算机,它成为历史上第一台突破万亿次浮点计算屏障的超级计算机。紧接着,IBM的SP2、日立公司的SR2201和SGI公司的Origin2000超级计算机都先后出现。值得一提的是Origin2000系列后来成为SGI公司制作电影CG的主力,很多大场面的电影都有它的功劳。
1996年12月,SGI公司研制出一台具有256个处理器的超级计算机安装在美国国家实验室。这个系统的处理器还将增加为4096个,运算速度达到了30000亿次。
进入2000年之后,超级计算机的竞争日渐激烈,日本和美国彼此成为最大的竞争对手。比如在2003年世界前十名的超级计算机名单中,日本的“地球模拟器”排在榜首,后面全是清一色的美国产超级计算机。而保持运算速度最快记录的超级计算机则是日本NEC刚刚发布的SX-8,每秒运算速度高达65万亿次。
在厂商之间,IBM、英特尔、DELL、NEC和SGI的竞争一向激烈,近来又冒出了苹果。这家公司的G5苹果超级计算机已经后来居上,超过英特尔居于超级计算机排行榜的第三位。在中国,联想和曙光同样开发了国产超级计算机,在全球500强超级计算机中能够看到中国人的身影。
中国超级计算机历史
世界上第一台数字电子计算机诞生于1946年,中国电子计算机的科研、生产和应用是从上世纪五十年代中后期开始的。1956年,周总理亲自主持制定的《十二年科学技术发展规划》中,就把计算机列为发展科学技术的重点之一,并筹建了中国第一个计算技术研究所——中国科学院计算技术研究所。1957年,哈尔滨工业大学研制成功中国第一台模拟式电子计算机。1958年8月1日,我国第一台数字电子计算机——103机诞生。
第一代计算机采用电子管。美国研制出第一代计算机用了4年(1943-1946,标志:宾夕法尼亚大学莫尔学院的ENIAC),而中国通过学习苏联的技术,仅用3年就完成了(1956-1958,中科院计算所的103机),并生产了38台。
第二代计算机采用晶体管。美国从第一代计算机进入第二代计算机花了9年时间(1946-1954,标志:贝尔实验室的TRADIC),中国用了7年(1958-1964,标志:哈尔滨军事工程学院,即国防科技大学前身的441B机),生产了约200台。
第三代计算机采用中、小规模集成电路。这段发展过程美国用了11年(1954-1964,标志:IBM公司的IBM360),中国用了7年时间(1964-1970,标志:中科院计算所的小规模集成电路通用数字电子计算机“111机”)。
1965年,中国自主研制的第一块集成电路在上海诞生,仅比美国晚了5年。在此后的岁月里,尽管国外对我国进行技术封锁,但这一领域的广大科研工作者和工人阶级,发扬自力更生和艰苦奋斗的精神,依靠自己的力量建起了中国早期的半导体工业,掌握了从拉单晶、设备制造,再到集成电路制造全过程,积累了大量的人才和丰富的知识,相继研制并生产了DTL、TTL、 ECL等各种类型的中小规模双极型数字逻辑电路,支持了国内计算机行业。当时具备这种能力的国家除中国外,只有美国、日本和苏联。
1983年12月22日,中国第一台每秒钟运算一亿次以上的“银河一号”巨型计算机,由国防科技大学计算机研究所在长沙研制成功,使我国成为能研制巨型机的少数几个国家之一,该成果荣获特等国防科技成果奖。
"银河"系列超级计算机
1983年12月4日,是我国计算机技术发展史上永远值得纪念的日子。这一天,我国自行研究与设计的第一台亿次巨型计算机提前一年研制成功,通过鉴定;它的诞生标志着我国计算机技术水平踏上了一个新台阶。
1986年年初,国防科技大学计算机系申请研制“银河Ⅱ”10亿次巨型计算机,得到了国务院、中央军委和当时的国防科工委的批复,1992年11月国防科大成功研制出“银河Ⅱ”10亿次巨型机,实现了从向量巨型机到处理并行巨型机的跨越,成为继美国、日本之后,第三个实现10亿次超级计算机的国家。1994年,银河Ⅱ超级计算机在国家气象局投入正式运行,用于天气中期预报。
1994年3月,在市场激烈的竞争中,“银河-Ⅲ”正式立项。三年后,1997年6月19日,“银河-III”百亿次巨型计算机系统通过国家技术鉴定,它的研制者还是国防科技大学计算机研究所。从1亿次到百亿次,从多处理并行巨型机到大规模并行处理巨型机的跨越;标志着我国已经掌握了高性能巨型计算机的研制技术,而拥有这一技术的国家屈指可数。2000年由1024个CPU组成的“银河-Ⅳ”超级计算机问世,峰值性能达到每秒1.0647万亿次浮点运算,其各项指标均达到当时国际先进水平,它使我国高端计算机系统的研制水平再上一个新台阶。
2006年9月诞生的“神威Ⅰ”的峰值运算速度为每秒3840亿浮点结果,在国家气象局用于气象数值计算。该机在世界已投入商业运行的前500台高性能计算机中排名第48位,其主要技术指标和性能达到国际先进水平。
"神威"系列超级计算机
上世纪80年代末90年代初,世界计算机领域悄悄地孕育着一场革命,传统的向量机发展受到了限制,大规模并行机悄然问世。金怡濂教授敏锐地洞察到这一新的发展趋势是实现中国计算机跨越发展的一次重要机遇。与此同时,机遇也落到了他的身上,他担任了国家重点工程———“神威”巨型计算机系统的总设计师。
金怡濂教授当即提出了一个我国超大规模巨型计算机研制的全新的跨越式的方案。这一方案不仅当时在国内尚无先例,而且把巨型机的峰值运算速度从每秒10亿次跨越到每秒3000亿次以上,跨越了两个数量级。在国家并行计算机工程技术研究中心召开的“神威”机研制方案论证会上,许多人对此方案表示惊讶、怀疑,甚至反对,提出继续搞比较保险的传统机型。金怡濂力排众议:“不挑战就会失去竞争的机会,不突破就没有中国巨型机的崛起。”经过他的精辟分析,与会专家最终通过了他提出的总体方案。实践证明,这是一个具有战略意义的跨越,闯出了一条中国巨型机赶超世界先进水平的发展道路。
气象预报是超级计算机最重要的应用领域之一。在神威Ⅰ型机上运行的“集合天气预报系统”采用了32套原始数据,输入计算机进行运算,然后得出32个结果,再运用气象学的知识和统计的规律,在这个结果群里,找出可能性最大的未来天气的情况。以往10天的天气数值预报,在百亿次机上运算大约需要640小时,等预报结果出来时,就已经不是“预报”了。利用“神威”机进行运算,则只需要8小时。
“神威”机的另一项重要的应用就是石油勘探。要开采石油,必须钻井。打一口井耗资巨大,差不多要几百万甚至上千万,如果选择的钻井地点有偏差,那么投入的人力、财力、物力就会全部浪费,损失巨大。因此提前的精确测算格外重要。
在认为可能的地方进行人工爆破,然后搜集爆破后的反应,记录它的反射弧,把这些数据送到计算机上进行处理,地质专家再根据得出的结论分析石油的分布。应用“神威”机后,可以明显提高分析面积和准确程度。
“神威”机在石油领域的另一个重要应用是“油藏模拟系统”。类似大庆那样的老油田,油采出来还要注水平以衡压力。现在地下还剩下多少油,也是需要大量的计算。用普通的工作站,可能要算一个月才有结果,而为了提高准确度,一套程序要算好几遍。一次就要一个月,显然达不到要求。用了神威机之后,由一个月变成了一个星期,现在变成了几个小时。
"深腾"系列超级计算机
中国超级计算机谱系表
国防科技大学计算机研究所——“银河”系列
银河-Ⅰ 1983年
银河-Ⅱ
银河-Ⅲ
银河-Ⅳ
天河一号
中科院计算技术研究所——“曙光”系列
曙光一号
曙光-1000
曙光-1000A
曙光-2000Ⅰ
曙光-2000Ⅱ
曙光-3000
曙光-4000L
曙光-4000A
曙光-5000A
曙光-星云
国家并行计算机工程技术中心——“神威”系列
神威-Ⅰ
神威3000A
神威蓝光
联想集团——“深腾”系列
深腾1800
深腾6800
深腾7000
深腾X
曙光5000百万亿次超级计算机,该系统位居最新公布的全球高性能计算机排名(TOP500)第10位。前9名均为美国研制。目前普通家用电脑的运算速度为每秒20亿次左右,曙光5000百万亿次超级计算机的运算能力相当于10万台个人电脑,共有6000颗CPU与100T海量内存,拥有30720个处理器内核,其理论浮点峰值为每秒260万亿次,采用20GB,延迟小于1.3us的Infiniband高速网络进行互联,采用了WCCS + SuSe Linux 双操作系统。其每天耗电超过1万度,售价约2亿元。
联想“深腾7000”百万亿次超级计算机,该系统位居最新公布的全球高性能计算机排名(TOP500)第19位,售价超过1亿元人民币。联想“深腾7000”是世界上规模最大的一个结点无盘启动的机群系统,成功实现了基于1428个无盘结点的机群系统。同时,它也是世界上第一个实现了对所有硬件部件统一管理和监控功能的机群系统,实现了对机群系统内数千个计算、互连、存储等硬件部件的统一管理和监控。
1951年的存储坦克(memory tank),存储容量20000 bytes。这是史前时代的存储器,容量相当于20K。在计算机诞生初期并不存在内存条的概念,最早的内存是以磁芯的形式排列在线路上,每个磁芯与晶体管理组成的一个双稳态电路作为一比特(bit)的存储器,每一比特都要有玉米粒大小,可以想象,一间的机房只能装下不超过百k字节左右的容量。后来才出线现了焊接在主板上集成内存芯片,以内存芯片的形式为计算机的运算提供直接支持。现在我们使用的内存条,单根容量都在1G以上,是这个家伙的50000倍。
这是计算机博物馆中重达27公斤,只能够存储5MB容量的硬盘。而现在我们家用电脑使用的硬盘容量,已经达到了1TG,是它的20万倍。这种史前时代的老古董,确实很神奇。人类科技就是在这种匪夷所思的变化中不断前进。
IBM 1965年推出的System 360大型主机,被美国航天局用于首次载人登月任务。
1978年,美国DEC公司推出第一款32位超级计算机 DEC VAX,有高达1MIPS的运算性能,售价200000美元.
日本NEC地球模拟器,基于NEC SX架构,640个节点,每个节点有8个矢量处理器(每个处理器的峰值速度为每秒8 Gflop,周期为2ns,16G共享内存,总共5140个处理器,峰值速度为每秒40万亿次,10TB内存,700TB硬盘空间,16PB海量储存,占地面积=4个网球场,3层楼。曾经是世界最快的超级计算机,现在已经落伍。
世界第九,欧洲最大超级计算机MareNostrum,它位于西班牙加泰罗尼亚市加泰罗尼亚科技大学(UPC)园区,巴塞罗那超级计算中心(BSC)。它拥有10240颗IBM Power PC 970MB处理器,峰值计算速度能够达到94.21万亿次浮点计算。组成MareNostrum的2560台JS21刀片式计算结点占据了大约半个篮球场(120平米)的面积,由美国IBM公司负责建造。
美国IBM公司为德国尤里希研究中心(FZJ)打造欧洲首台千万亿次超级计算机,该系统拥有72个机柜,内置294912颗IBM PowerPC 450 850MHz处理器(四路SMP)、144TB内存和6PB硬盘,网络延迟160ns,带宽5.1GB s,总功耗2200KW。
在2008年11月评选的超级计算机500强榜单中:
德国最快的超级计算机是美国IBM的“蓝色基因”,理论峰值速度223万亿次每秒。用于FZJ研究中心,排名11位。
印度最快的超级计算机是美国惠普的EKA3000BL460C,理论峰值速度172万亿次每秒,用于塔塔公司,排名13位。
法国最快的超级计算机是美国SGI的ALTIX ICE 8200EX,理论峰值速度146万亿次每秒,用于GENCI-CINES,排名14位。
英国最快的超级计算机是美国IBM的POWER 575,理论峰值速度126万亿次每秒,用于ECMWF,排名21位。
日本最快的超级计算机是由美国Cray(日本)公司为日本筑波大学、东京大学和京都大学制造的T2K开放式超级计算机系统,采用的是3808颗美国AMD四核皓龙™处理器,峰值速度113万亿次每秒,排名世界超级计算机500强的27位。日本NEC的地球模拟器已经落到了73位,峰值速度才41万亿次每秒,是联想深腾7000的四分之一。
俄罗斯最快的超级计算机是美国惠普的MVS-100K,理论峰值速度95万亿次每秒,用于联合超级计算中心,排名35位。
世界各大国里面只有美国、中国是自己制造的百万亿次超级计算机,由于美国严格的高技术禁运政策,如果不是我们自己能研制出来,那么我国现在最快的超级计算机,也就是从IBM买来的25万亿次每秒的淘汰产品。
2009年6月15日,国内首台百万亿次超级计算机 “魔方”,在上海正式启用。
2009年6月15日,国内首台百万亿次超级计算机 “魔方”,在上海正式启用。
2009年10月29日,中国第一台千万亿次超级计算机——天河一号,在湖南长沙亮相。“天河一号”由140个机柜组成,每个机柜1.45米宽、1.2米深、2米高,排成13排,这个方阵占地约700平方米,总重量约160吨。2010年11月16日,在国际超级计算机TOP500组织正式发布第36届世界超级计算机500强排行榜上,中国研制的“天河一号”超级计算机,以峰值速度4700万亿次、持续速度2566万亿次每秒浮点运算的优异性能,位居世界第一。比排名第二的美国“美洲虎”超级计算机快了1000万亿次。
天河一号千万亿次超级计算机,运算1小时的工作量,相当于全国13亿人同时计算340年;运算1天,相当于1台双核的高档桌面电脑运算620年;总的存储容量能够容纳1千万亿个汉字,相当于1个存储10亿册100万字书籍的巨大图书馆。目前,“天河一号”已在石油勘探、高端装备研制、生物医药、动漫设计工程设计与仿真分析、气象预报、遥感数据处理等方面获得成功应用。这台巨型计算机,每小时耗电4040度,日耗电近10万度,这在世界超级计算机家族中,已经算是比较节能的“绿色电老虎”了。
天河一号千万亿次超级计算机中,安装有2048颗国防科技大学研制的飞腾1000(FT-1000)流处理器芯片。飞腾1000(FT-1000)为64位8核处理器,采用GPGPU架构,65纳米工艺,3.5亿个晶体管,主频达到1GHz,可实现64线程并行运算。
“星云”千万亿次超级计算机位于深圳国家超级计算机中心,由曙光公司的曙光TC3600刀片系统集群组成,最大浮点性能为1271万亿次每秒,是世界第三台实现双精度浮点计算超千万亿次的超级计算机。2010年5月,在德国汉堡举行的2010年国际超级计算大会上,TOP500.org组织公布了第35届全球超级计算机五百强排行榜,中国曙光公司研制的“星云”千万亿次超级计算机,排名世界第二。当时世界最快的超级计算机,是位于美国田纳西州橡树岭国家实验室的“Cray Jaguar”,主要用于模拟核试验,去年11月它的峰值速度是每秒1750万亿次。在上榜计算机总数上,中国此次共有24套超级计算机上榜,与德国持平,位列美国(282)、英国(38)、法国(29)之后,另外中国香港也有一套系统入围,中国台湾则已从榜上消失。
神威蓝光千万亿次超级计算机采用的申威1600型16核64位CPU处理器,是由无锡江南计算技术研究所研制的第三代处理器,2010年8月完成,采用Alpha RISC架构,主频1.1G,功耗35-70瓦,65纳米代工工艺,峰值运算速度达每秒1408亿次。运算速度高于日本富士通研制的SPARC64 VIIIfx处理器,和美国英特尔酷睿i7 980XE。