六名"超算"高手齐聚 清华学生夺国际"超算"总冠军
八台计算机通过高速交换机连接,处理器运行速率最高可达每秒钟5.6万亿次。这几乎就是一台微缩版的“天河二号”计算机。预测天气、分析基因组甚至模拟“外族入侵”,经过精心搭建平台、程序调试的“小天河”在48小时内高速运行游刃有余。
这是清华大学六位本科生前不久在美国得克萨斯州交出的精彩答卷,他们最终拿下了国际大学生超级计算机竞赛的总冠军,也是大陆高校首次在该项比赛中获得总冠军。记者了解到,超级计算机在包括雾霾重污染预测预报等民生领域有广泛的用途,清华大学在这一领域已经为国家培养了大批人才。
六名“超算”高手齐聚
国际大学生超级计算机竞赛是超级计算机领域的顶级赛事,每年举办一次,吸引着世界各个国家和地区的众多高校参与。报名参加超算大赛并不是一件容易的事情,首先必须要有足够支撑高速运算的设备,也就是超级计算机,“这和我们平时用的笔记本、台式机等家用计算机完全不是一个概念。”团队成员王邈说,普通的家用笔记本电脑,运算效率不到1000亿次,他们最后参赛的超级计算机,运算效率高达每秒5.6万亿次。经过学校和老师的多方努力,终于有厂商愿意赞助符合条件的计算机服务器。
有了计算机,还得有懂行的人。幸好,清华并不缺计算机的狂热爱好者。无论是“学堂计划”、“卓越计划”还是“星火班”,各种科创平台上活跃着大量对于超级计算机痴迷的年轻人。梁盾、鲁逸沁、梁俊邦、裘捷中、卓有为、王邈,不同年级的六人参赛团队迅速集结,其中裘捷中、王邈等曾多次参加国际计算机大赛。团队还请来高性能所硕士研究生李恺威担任教练,计算机系教师翟季冬担任比赛指导教师。
王邈说,拿到试验的计算机后,他们团队起了一个名字Diablo,与一款经典游戏一样。“这是我们一位同学的实验室计算机的名字,被我们引用了。希望我们的计算机在处理数据时能够具有所向披靡的力量。”他说。
凌晨一点休息不算熬夜
今年5月,比赛报名申请获得通过,六人团队正式进入了备战状态。根据规则,主办方在今年夏天公布了比赛的5个应用程序,内容涵盖天气预测、量子力学、人类基因组等多个实际应用问题。“他们提供一系列相关应用问题的基础程序代码,我们需要做的就是等正式参赛,获得具体数据后,用我们的计算机以最快的速度跑完所有题目的程序,并获得有价值的结果。”团队成员梁俊邦对记者说。
这看似简单,其实并不容易。以天气预测为例,涉及到地理、水文等多方面的知识,队员们不可能在不知道输入数据的情况下盲目优化程序,否则要么陷入逻辑困境,永远得不到结果;要么就会得到完全相反的答案。为此,他们专门请教了学校地球系统科学研究中心的老师,尽可能找类似的数据进行模拟。
合理搭建的计算机硬件架构对于高速运行数据程序至关重要。在这方面,队员们也遇到了不少困难。“我们整个比赛一共投入了八台计算机进行组网运行,但是因为缺少足够的高速网络连接设备,整个国内备赛期间只能使用其中两台计算机进行模拟。”王邈说,这对比赛的预判提出了很高要求,“我们只有尽可能预判到时候八台机器一起运行时可能出现的故障,并准备好预案。”
比赛的准备阶段紧张而艰辛。由于团队主力都是本科生,他们本身课业压力相当大,为了准备比赛,队员几乎将所有的课余时间都用来查阅专业知识、进行前期准备。每周都有例会,不同年级的同学相互交流,遇到不能解决的问题集体讨论,以保证前期准备的进展。“凌晨1点休息?那根本就不算熬夜。”王邈说。
比赛48小时不间断进行
150多个日日夜夜的辛勤备战最终迎来考验。11月13日,清华超算团队经旧金山飞往比赛地——得克萨斯州奥斯汀市。裘捷中说,在候机时队员们仍然抱着笔记本进行最后的测试优化。
比赛在奥斯汀的一个会展中心举行,整个清华团队的场地是一个面积大约20平方米的半开放空间。他们见识到了国外团队的硬件水平。王邈说,根据规则,每队所有参赛计算机的总功率不能超过3120瓦,“我们8台计算机组合后功率就超了,只能降低负荷运行。而有的参赛队用10台计算机组合功率都不超。”更要命的是,清华团队一共就8台计算机,没有备份,而其他的参赛队的备用机“在墙角摞了起来”。
比赛开始了,各队需要在自行搭建计算集群上完成5个已公布程序、1个神秘程序。比赛48小时不间断进行,对队员们的身心压力极大,同时也考验着队员们亲手搭建的超级计算机的稳定性。这时,清华团队经历了“起死回生”的考验。
最后一天的凌晨,一直盯着设备的王邈突然发现一台机器停止运行。这时候,有个程序即将进入多机运行阶段,“好比一台车即将由单车道的乡村路驶入高速路赶往目的地,高速路的车道突然堵了。”王邈说,比赛不允许重启机器,而一旦不能多机运行,之前的付出将功亏一篑。他开始了紧急处理,“通俗的说就是一方面让已经驶上高速匝道的车速度慢下来,一方面利用时间赶紧抢通高速公路。”15分钟后故障终于被顺利排除。最终,清华大学超算团队以总分排名第一的优异成绩,夺得国际大学生超级计算机竞赛的冠军。“48小时,我们终于赢了这场战役!”望着大屏幕上出现的最终结果,清华团队的队员们欢呼雀跃。
超级计算机未来大有可为
专家告诉记者,所谓的超级计算机,就是由成千上万台高性能计算机通过高速互联网络组成的大规模计算机集群,它的发展源于现代社会对计算量的巨大需求与一般处理工具计算力不足之间的矛盾。在现代社会,超级计算机在天气预报、舰船设计、金融分析等领域都有着广泛的应用前景,“现在的雾霾重污染预报预测,需要在短时间内对于污染物浓度、诸多天气要素等大量数据进行高速计算处理,处理速度和精度直接决定了预报发布的速度和准确性。”
队员们在做自己的努力。今年大四的裘捷中已经保送攻读直博研究生,梁俊邦正在申请赴美留学。大三年级的王邈也已经进入一家新兴智能科技公司实习。
记者了解到,在清华大学计算机系的历史上,也曾有一个和超算团队同样年轻的团队。就在60年前,新中国首台电子模拟计算机在清华诞生,当时清华参加攻关的研究组平均年龄不到23岁。此后该校为我国的超级计算机发展培养了大批人才。2015国际超级计算大会发布了最新一期世界超级计算机500强排行榜,中国研制的“天河二号”超级计算机系统第六次夺冠。而“天河二号”项目的总指挥、总设计师廖湘科,就是清华大学1980级计算机系校友。