淘客熙熙

主题:超级计算机世界排名今年出现大变化 -- 彼得格勒

共:💬72 🌺501 🌵16 新:
分页树展主题 · 全看首页 上页
/ 5
下页 末页
      • 家园 不过目前看来中国E级机的技术不是特别成熟

        评论中有同志提到今天美国公布的Summit峰值性能达到了200PF,问我兔有何计划。答:正如原答案中预测的(也就是圈里的专家都知道的)那样,美国这几年就是会发布几台150PF~400PF的超算机器。Summit只是其中一台(由IBM和NVIDIA搭建),不久之后可能Aurora(intel 出品)也会发布,预计峰值约180PF。因为这些机器的建造都是意料之中的事,所以也说不上什么应对策略,中国下一代超算的研发制造仍在按计划进行,今年年内将部署三台E级原型机(规模很小,只是用来验证设计思路),然后根据三台原型机(代表不同技术路线)的表现确定下一代超级计算机的技术路线,不过想看到新的大机器估计得等到2020年了吧。2020年如果有新的超算发布,也不会是E级(百亿亿次),答主猜测可能是200PF~500PF之间,想要看到E级机,估计得等到2022年以后。当然也不排除为了献礼第一个一百年而抢先做全球第一个E级机,不过目前看来中国的技术不是特别成熟,可能还是会让美国抢占先机。欧洲和日本的状态似乎不太可能继续参与第一名的竞争,但可能会在节能计算或者某些特定应用方面有所突破。

        通宝推:PBS,
        • 家园 大师这么相信网上的消息啊

          中国没那么透明滴。话说2015年美国宣布对天河二号芯片禁运,导致该机器无法升级,问中国行内人士怎么办,人家笑而不答。后来才知道,神威太湖之光这台机器当时就已经出来了,雪藏了一年,到2016才公开,这之前是总参保密项目,外界谁都不知道,不信大师就去找找,看看有没有2016年之前对神威的报道。。。

          • 家园 你从网上得到的消息都是扭曲的

            知乎上的一个行家对太湖之星的评论很有见地

            太湖之光的CPU sw26010在设计取向上是针对“暴力浮点”优化的,出现上面这个结果(FLOPS强,某些其他测试不太好)意料之中。

            比较显著的一个指标是这个CPU的内存带宽/浮点比率达到令人难以置信的1/22.4=0.045 Byte/FLOP。作为对比(数据来源Yokota,J Algo Comp Tech, 7,3,2013):

            INTEL Xeon E5 2690: 0.211

            AMD Opteron 6284 SE: 0.235

            NVIDIA Fermi GF110: 0.266

            IBM PowerPC A2(BG/Q):0.208

            Fujitsu Sparc64(FX10):0.359

            相比较而言sw26010的内存带宽太小,很多操作都会卡在内存上。实际应用上,优化好的FMM或者DGEMM大概需要0.2,使用特殊向量指令还可以更低,3D FFT大概需要0.6~0.9, stencil大概2~3,spmv大概5。在x86上FMM/DGEMM是compute bound,后面几个都是memory bound,而在sw26010上这些操作几乎全都是memory bound。

            所以在Graph500里面太湖之光落后内存带宽有很大优势的Sparc64 K是很正常的结果。

            这是设计取向问题。

            作为一个HPC用户,sw26010这样的cpu很难优化,内存带宽小是一方面。另一方面计算核有“The Computer Processing Element (CPE) is composed of an 8x8 mesh of 64-bit RISC cores, supporting only user mode, with a 256-bit vector instructions, 16 KB L1 instruction cache and 64 KB Scratch Pad Memory (SPM).”只有很小的L1指令缓存,要靠手工维护scratch pad memory,这个内存结构有点像Fermi架构之前的nvidia GPU,nbody这种简单暴力的写起来比较适合,想做点复杂的就很麻烦。

            从太湖之光官网的软件环境(国家超级计算无锡中心)里也可以看出,目前科学计算软件里大量的都是比较适合这类CPU结构跑的nbody类型分子模拟程序,比如NAMD,LAMMPS,Amber,GROMACS之类。

            另一方面在缺乏Petsc/trilinos这样的并行计算基础库的条件下给太湖之光写代码是

            成本非常高的事情,一般大学里只有极少数实力强大的组有这个条件(经费、时间、人力)从底层开始写一套大程序,这也制约了这一套系统的潜在用户数量。用户数太少的话软件基础设施永远停留在比较原始的阶段。

            通宝推:PBS,
            • 家园 呵呵,知乎上面见闻性质的常识正确性偏高;涉及技术问题。

              尤其是专业性技术极高的问题基本就是滥竽充数;我应该是看过关于超算的帖子问答。基本都是外行和一些对外的通用名词罢了;

            • 家园 错得都没边了

              你这“行家”眼里这么烂的机器怎么还得到戈登贝尔奖呢,这可是超算软件最高奖哦。这位“行家”还说太湖之光上面没装Petsc,俺快笑倒了,不知道得奖的软件调用了Petsc啊,这都不知道还装什么大神?

              至于跑MD跑得多(给大师科普一下:NAMD,LAMMPS,Amber,GROMACS这些都叫MD -- 分子动力学软件),多新鲜啊,MD是超算的主要应用,俺还没见过MD跑得少的超算呢。。。

              通宝推:李根,武工队,
            • 家园 您说对了

              这些个超算都是编专用程序的,会编的人少,能用的地方也不多。

              看看美帝的商业软件,基本都是给行业定调的,不会用就啥都干不了。说回中兴了,即使美帝出口芯片,只要把软件id一禁用,照样倒闭。

              无比懊恼。

              • 家园 你这就是不懂瞎说

                超算软件绝大部分开源,反过来说,商业软件在超算上面跑得快的还真不多。。。

                • 家园 当看到开源两字的时候。。。就不用再多讨论了

                  明显,你既没有在工业界的真实经验,也没有在军工界的真实经验。

                  最多,就是在学术圈子里,所以才如此推崇开源,迷信开源。

                  • 家园 同意,工业界一般不会用开源的;军工界更不会用开源的;

                    商业公司,采用开源,尤其是创业公司;

                  • 家园 del

                    del

                    • del
                      家园 得罪了,抱歉

                      这里又不是你好我好大家好的地方。

                      好歹也是因为想有所收益有所学习才会来这里的。

                      我说错的地方,敬请指出来。我错了,我应该会改之。至少在西西河,似乎我还不是一个有错不改死要面子的人: 在网上要面子,有意思么?

                      我说对的地方,你喜欢,则送一朵花。你欣赏,则加一个宝。你不喜欢,绕道就是了。

                      好么。

                  • 家园 莫名其妙,俺说了半句开源好或是坏嘛

                    俺说的就是一个客观事实:最好的超算在学术圈,而学术圈的超算以开源软件为主,别用商业软件的逻辑来套超算。。。

                    • 家园 俺没有说开源好,或不好。。。只是。。。

                      工业圈:消费级工业圈,工业级工业圈,轻工业圈,重工业圈,军工工业圈。。。

                      所谓最好的超算在学术界,我只能呵呵两个字。

                      你太迷信学术两个字了。我只是想说,学术,追求的价值取向,与工业是不同的。

                      什么时候你明白这一点了,再来看所谓的开源,所谓最好。

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河