“天河二号”全球超算排名六连冠 广东正筹建8个超算分中心_前沿_南都有数_奥一网
×

使用奥一网帐号登录

使用合作帐号登录

“天河二号”全球超算排名六连冠 广东正筹建8个超算分中心

2015-11-27 08:52:19南都科学
最新一期的全球超级计算机500强榜单中,“天河二号”实现六连冠,浮点运算速度达到每秒33 .86千万亿次,是第二名美国“泰坦”的两倍多。全球超算速度排名第一的“天河二号”到底有什么用,与普通人有没关系?

   2015年以来,广州超算中心共开展20多期培训,培训学员近1000人。

   商用客机全机全参数气动优化设计。

   (左)零质量中微子反演示意图。    (右)大质量中微子反演示意图。

   广州超算中心位于中山大学大学城校区,占地面积67000平方米。

最新一期的全球超级计算机500强榜单中,“天河二号”实现六连冠,浮点运算速度达到每秒33 .86千万亿次,是第二名美国“泰坦”的两倍多。全球超算速度排名第一的“天河二号”到底有什么用,与普通人有没关系?南都记者近日走进“天河二号”所在的广州超算中心,揭秘这个“最强大脑”的超级应用:天气预报超算程序已经优化,在20分钟内实现对3公里精度的预报,未来还有望“搞掂龙卷风预报”;刚下线的国产大飞机,2年的气动优化实验,“天河二号”仅用了6天时间就完成了;经济仿真虚拟实验室,不仅仅是模拟炒股,更是根据经济大数据等,模拟整个经济社会的运行;在生物医药领域,“天河二号”的终极目标,是建立孪生数字人。

速度有多快?

天河二号运算一小时

13亿人同用计算器算千年

据测算,天河二号的峰值计算速度达到每秒5.49亿亿次,而持续计算时的实测速度每秒可达3 .39亿亿次。这个速度到底有多快?国家超级计算广州中心主任袁学锋如此形容——— 假设每人每秒钟进行一次运算,天河二号运算一小时,相当于13亿人同时用计算器算上1000年。而其存储容量相当于,存储每册10万字的图书600亿册。

为什么如此之快?袁学锋介绍,天河二号一期系统共有16000个运算结点,每结点配备两颗X eonE512核心的中央处理器、三个Xeon Phi57核心的协处理器(运算加速卡)。累计32000颗XeonE5主处理器和48000个X eonPhi协处理器,共312万个计算核心。

天河二号超算系统由广东省、广州市国防科技大学、中山大学共同建设,总投资25亿元,是广东最大的科技基础设施。2015年9月,广州市正式将广州超算中心移交中山大学进行管理。“别人能算的,我们比他算得快,别人不能算的,我们也能算。”袁学锋说,天河二号集高性能计算,大数据分析和云计算于一体,能高效处理计算密集型问题,也能满足对复杂数据进行实时分析的需求。“这是普通的云中心做不到的。”

哪些人在用?

634家用户目前在用

每周使用量北大通常排第一

袁学锋特意提醒,天河二号还处在建设期。这意味着,目前天河二号释放给社会的资源是有限的。不过,即便尚在建设期,天河二号的产出已足够耀眼。2014年4月试运营以来,截至上周,天河二号已服务的用户家(单位)数达634家,包括高等院校、科研单位和企事业单位等。

“而整个天津超算从2009年至今,总共服务的单位数为600家左右。”袁学锋说,完全靠市场化拓展,天河二号在建设期的用户量已超过天津超算。“去年11月天河二号服务用户数270家,到今天一年时间翻了一倍多,年底还会有明显增长”。他还预测,不久服务用户家数将翻倍过千。“为推广使用天河二号,由广东省与自然科学基金共同推动的超级计算重大专项很快要启动,这个项目将资助604家签约单位,其中只有23%用过天河二号。”

袁学锋拿用户北京大学打比方,北大很多课题组前来购买大量资源,在超算上算题。“每周看各单位的使用量,北大通常高居榜首”。目前,超算85%的用户为远程登录,整个流程均在互联网上完成计算资源申请和使用。袁学锋透露,当前天河二号每周运营成本约100万,今年已连续两月“打平”,即实现收支均衡。今年天河二号的销售额也可观。他预计,“明年有望破亿,这在国际上全市场化的运营是绝无仅有的。”

超算中心安全吗?

“彩虹”致大面积停电

“天河二号”也“中招”

今年10月,台风“彩虹”袭粤,广州番禺的500千伏广南变电站失压,5个220千伏变电站失压,导致海珠、番禺大面积停电,天河二号也“中招”了。“当时我在家里,一看情况不妙,赶紧跑过来了。”袁学锋说,当时整个大学城全部停电长达数小时。由于电压不稳,天河二号值班人员果断命令关机。“预案很到位,机器、数据都保护完好,基本没造成大损失。”据他介绍,电压不稳的最坏结果是将机器打坏。

天河二号负荷需求量大、供电可靠性要求高,共有三条供电线路,台风中,两路电源全被“干掉”。另一个由南方电网专门为超算建设的燃气发电站,预计明年6月启用,届时将为天河二号提供30%的电源。关机一天多,直到电压稳定,天河二号才恢复开机。袁学锋说,“所有的数据不能只靠超算中心,或许在几十甚至上百公里之外,一定要有备份、储存。”

为了给庞大的数据备份,是建设超算分中心的原因之一。目前全省范围内已有8个超算分中心在进行正式洽谈,包括天河、南沙、黄埔、番禺、增城、惠州、中山、韶关。其中南沙分中心很快将交付启用,番禺和天河分中心也正在建设中。“在谈的都是认真的,签了协议”。袁学锋诙谐说。他认为,未来智慧城市的数据架构应当是分布式的,下到街道、小区、区、城市、省。多层次分布式的数据存储、互为灾备才比较安全可靠。“不能把所有鸡蛋放进一个篮子,那样太脆弱了。”

应用

天体物理

已模拟137亿年演化

很快将观测宇宙边界

宇宙是怎么来的,这是一个终极问题。北京师范大学、加拿大高能研究所和国防科技大学在天河二号上,对中微子宇宙尺度演化的问题进行了研究。袁学锋说,实验模拟了137亿年的宇宙结构演化过程,时间从宇宙大爆炸以后1600年至今。

另外,在天河二号,很快还将去观测宇宙的边界,寻找宇宙最早的一束光。袁学锋说,天河二号正在争取进入全球最大平方公里阵列射电天文望远镜项目的数据中心。“掌握全数据,才能掌握探索宇宙奥秘的主动权。”

他介绍,这一国际大项目持续到2030年,数据处理量巨大,在中国天河二号仅能满足到2020年,之后希望能有天河三号来服务于它。下个月,超算中心将举行SK A项目顶尖专家研讨会。SK A是世界最大的射电望远镜项目,建成后将有助于回答宇宙深层次问题,如大爆炸之后恒星和星系的起源,宇宙中的暗物质究竟怎样发挥作用以及寻找地球以外的生命等。

大飞机

2年气动优化实验

6天时间就能搞定

之前刚下线第一代国产大飞机C919的全机空气动力学验证就在天河二号上完成。全机全参数气动优化设计是大型民机气动设计的核心关键技术。“如果气动减少阻力0.1%的阻力,对商用飞机的省油将很有益处,这是很重要的一个指标”。

袁学锋透露,第二代大飞机———宽体客机的气动优化也在天河二号的模拟风洞完成。“做了5万多种不同形状的机型,挑选一个优化机型,通过局部优化,将气动阻力降到最低,最后再确定机型”。

以往,整个气动优化过程需要两年时间验证,但在天河二号,利用约2.4万CPU核,6天即完成实验。袁学锋说,超算的高性能计算,节省时间,节约成本,压缩研制周期,大大提高科研的竞争实力。

气象

能在20分钟内

实现3公里精度的预报

天文、地球科学与环境工程计算应用服务平台,是天河二号六大平台之一。平台已部属了FVCOM、CESM、WRF和paraFE M等开源软件,已支撑诸如全球大气模拟、全球海浪模拟、中国海南与东南季风相互影响模拟等多个计算项目。

大气运动是该平台最常见的计算之一,利用卫星、飞机、地面观测站等多种渠道收集大气的当前状态数据,借助超算及相应软件准确地定量预报大气的未来状态。袁学锋说,现在天气预报的超算程序已经优化,能在20分钟内实现对3公里精度的天气预报,而国内通常的天气预报一般在40公里外。

目前超算中心和广州市气象局正推进合作,准备将超算的预报推向业务系统。“前两周前,新任局长刚来谈完。这意味着未来广州市的天气预报就在我这干了。”他说,气象局或将长期驻扎超算中心。

2013年,广东省气象台台长冯业荣曾透露,天河二号或能为更精确的台风预报做出贡献。袁学锋告诉记者,目前中心暂未预报过台风。不过介于10月台风“彩虹”带来的龙卷风,目前在气象局未能监测到。天河二号将重点聚焦局部预报,比如直径在几公里内的龙卷风。“希望在超算上,通过完成更高精度的模拟,搞掂龙卷风预报”。

经济

仿真虚拟实验室

能提前预警经济震荡

经济仿真虚拟实验室,由广州市长程软件有限公司发起。董事长吴杰说,这是一个基于机理建模的模型,可能是第一个把亚当·斯密“看不见的手”仿真出来的实验室。“相当于大脑中枢系统,处理全球经济的海量数据。”远不仅是模拟炒股,它要根据金融交易大数据、工业生产大数据、经济大数据等,模拟整个经济社会的运行。

袁学锋则把它比为打仗时用的“沙盘推演”。天河二号能满足逼真模拟经济动态过程和海量经济数据分析所需的计算资源,实现及时精准预测,提高决策和风险管理水平。吴杰介绍,未来经济仿真虚拟实验室能实现国民经济历史过程的仿真,能进行政策推演,寻找最优方案,帮助政府提供政策建议,避免重大决策失误。此外它还能对整个国民经济同步控制。“计算机虚拟实时研究对策,指导国民经济运行。”通过虚拟运行进行经济预警。“若虚拟仿真显示,未来会出现经济震荡,提前几天或几月知道都有可能。”

吴杰说,该模型以往的实验结果没有超过5%的误差。目前该模型已在天河二号上联调,预计半年内将启用。“可让上万个客户同时登录网站,调用模型进行计算。”打比方,金融投资者可在超算中心租用一个模拟器,把问题和参数输入,就可直观看到这个行业的发展趋势,或者为你指出哪只股票更合适投资。

医疗

将建孪生数字人

实施精准医疗国家战略

今年,天河二号在一天之内,完成4200万现有药物针对埃博拉新型病毒(蛋白)的有效评价与筛选。据相关报道,这相当于把包括现有药物、天然产物和人工合成有机化合物在内的地球上所有可用于药物研发的化合物都计算筛选一遍。这为人类应对暴发性恶性传染病的应急药物快速研发,提供了强大的计算模拟保障。

袁学锋介绍,在生物医药领域,超算的终极目标是,建立孪生数字人。通过国际合作,孪生数字人的平台正在搭建中,涉及到细胞、组织、人体模型、中医针灸等诸多方面。全世界暂没有具有生命信息的孪生数字人诞生。袁学锋说,广州研究孪生数字人的优势在于,钟世镇教授从2002年开始获得6个“虚拟中国人”的数据已数字化,目前有整套数据作为孪生数字人基础。

“很难实现,涉及的数据量巨大,涉及领域众多,很多人体的生物学奥妙连模型都没有,要整合、分析现有数据,查找规律,然后建模。”袁学锋说,平台已重点与中山火炬开发区医院、中山大学孙逸仙医院达成密切合作,帮助灾备医院各种医疗数据,脱敏(删除个人信息)后进入超算大数据平台。未来将利用虚拟数字人进行试验,诊断分析,实施精准医疗国家战略。

相关

用国产芯片升级明年速度将再翻一倍

按照计划,天河二号的二期建设即系统升级,于2015年底完成。不过,由于美国对相关产品的限购禁运,原定升级计划被推迟。“我们将利用国产芯片进行升级。”袁学锋说,目前升级方案已确定,研制方在紧张地对国产芯片进行测试和规模化试用,包括软硬件匹配,有大量的工作。“升级计划预计2016年底前完成”。升级后,运算速度将再次翻倍。峰值计算速度将由现在的每秒5 .49亿亿次提高到每秒10亿亿次以上,持续计算速度达到每秒6亿亿次。

算账

如果个人在超算上租用一个PC性能的资源,每天仅需4元。“用IPAD就能登录天河二号,在天河二号上的软件、计算环境配置是你自己的计算机完全不可比拟的”。

如果在天河二号租用一个机柜的性能,总计算能力接近400万亿次,一年的费用为200万。“如果你要建立类似计算能力的机构,光建设费不下2000万,不包括运营成本”。

超算上的能效比很高,每瓦特19亿次双精度浮点运算,即消耗每瓦特电量产生19亿次的计算能力。

出品:南方都市报科学新闻工作室 主持:陈养凯 采写:南都记者 贺蓓