主题：超级计算机世界排名今年出现大变化 -- 彼得格勒

共:💬72 🌺501 🌵16 新:

老大河待整

分页树展主题 · 全看首页上页下页末页

- - 复大师的消息早过时了，Aurora被推到2021年咯
    家园 不过目前看来中国E级机的技术不是特别成熟
    评论中有同志提到今天美国公布的Summit峰值性能达到了200PF，问我兔有何计划。答：正如原答案中预测的（也就是圈里的专家都知道的）那样，美国这几年就是会发布几台150PF~400PF的超算机器。Summit只是其中一台（由IBM和NVIDIA搭建），不久之后可能Aurora（intel 出品）也会发布，预计峰值约180PF。因为这些机器的建造都是意料之中的事，所以也说不上什么应对策略，中国下一代超算的研发制造仍在按计划进行，今年年内将部署三台E级原型机（规模很小，只是用来验证设计思路），然后根据三台原型机（代表不同技术路线）的表现确定下一代超级计算机的技术路线，不过想看到新的大机器估计得等到2020年了吧。2020年如果有新的超算发布，也不会是E级（百亿亿次），答主猜测可能是200PF~500PF之间，想要看到E级机，估计得等到2022年以后。当然也不排除为了献礼第一个一百年而抢先做全球第一个E级机，不过目前看来中国的技术不是特别成熟，可能还是会让美国抢占先机。欧洲和日本的状态似乎不太可能继续参与第一名的竞争，但可能会在节能计算或者某些特定应用方面有所突破。
    通宝推：PBS,
    - 复不过目前看来中国E级机的技术不是特别成熟
      家园 大师这么相信网上的消息啊
      中国没那么透明滴。话说2015年美国宣布对天河二号芯片禁运，导致该机器无法升级，问中国行内人士怎么办，人家笑而不答。后来才知道，神威太湖之光这台机器当时就已经出来了，雪藏了一年，到2016才公开，这之前是总参保密项目，外界谁都不知道，不信大师就去找找，看看有没有2016年之前对神威的报道。。。
      - 复大师这么相信网上的消息啊
        家园 你从网上得到的消息都是扭曲的
        知乎上的一个行家对太湖之星的评论很有见地
        太湖之光的CPU sw26010在设计取向上是针对“暴力浮点”优化的，出现上面这个结果（FLOPS强，某些其他测试不太好）意料之中。
        比较显著的一个指标是这个CPU的内存带宽／浮点比率达到令人难以置信的1/22.4=0.045 Byte／FLOP。作为对比（数据来源Yokota，J Algo Comp Tech， 7，3，2013）：
        INTEL Xeon E5 2690: 0.211
        AMD Opteron 6284 SE： 0.235
        NVIDIA Fermi GF110: 0.266
        IBM PowerPC A2（BG/Q）：0.208
        Fujitsu Sparc64（FX10）：0.359
        相比较而言sw26010的内存带宽太小，很多操作都会卡在内存上。实际应用上，优化好的FMM或者DGEMM大概需要0.2，使用特殊向量指令还可以更低，3D FFT大概需要0.6～0.9， stencil大概2～3，spmv大概5。在x86上FMM／DGEMM是compute bound，后面几个都是memory bound，而在sw26010上这些操作几乎全都是memory bound。
        所以在Graph500里面太湖之光落后内存带宽有很大优势的Sparc64 K是很正常的结果。
        这是设计取向问题。
        作为一个HPC用户，sw26010这样的cpu很难优化，内存带宽小是一方面。另一方面计算核有“The Computer Processing Element (CPE) is composed of an 8x8 mesh of 64-bit RISC cores, supporting only user mode, with a 256-bit vector instructions, 16 KB L1 instruction cache and 64 KB Scratch Pad Memory (SPM).”只有很小的L1指令缓存，要靠手工维护scratch pad memory，这个内存结构有点像Fermi架构之前的nvidia GPU，nbody这种简单暴力的写起来比较适合，想做点复杂的就很麻烦。
        从太湖之光官网的软件环境（国家超级计算无锡中心）里也可以看出，目前科学计算软件里大量的都是比较适合这类CPU结构跑的nbody类型分子模拟程序，比如NAMD，LAMMPS，Amber，GROMACS之类。
        另一方面在缺乏Petsc／trilinos这样的并行计算基础库的条件下给太湖之光写代码是
        成本非常高的事情，一般大学里只有极少数实力强大的组有这个条件（经费、时间、人力）从底层开始写一套大程序，这也制约了这一套系统的潜在用户数量。用户数太少的话软件基础设施永远停留在比较原始的阶段。
        通宝推：PBS,
        复你从网上得到的消息都是扭曲的
        家园 呵呵，知乎上面见闻性质的常识正确性偏高；涉及技术问题。
        尤其是专业性技术极高的问题基本就是滥竽充数；我应该是看过关于超算的帖子问答。基本都是外行和一些对外的通用名词罢了；
        复你从网上得到的消息都是扭曲的
        家园 错得都没边了
        你这“行家”眼里这么烂的机器怎么还得到戈登贝尔奖呢，这可是超算软件最高奖哦。这位“行家”还说太湖之光上面没装Petsc，俺快笑倒了，不知道得奖的软件调用了Petsc啊，这都不知道还装什么大神？
        至于跑MD跑得多（给大师科普一下：NAMD，LAMMPS，Amber，GROMACS这些都叫MD -- 分子动力学软件），多新鲜啊，MD是超算的主要应用，俺还没见过MD跑得少的超算呢。。。
        通宝推：李根,武工队,
        复你从网上得到的消息都是扭曲的
        家园 您说对了
        这些个超算都是编专用程序的，会编的人少，能用的地方也不多。
        看看美帝的商业软件，基本都是给行业定调的，不会用就啥都干不了。说回中兴了，即使美帝出口芯片，只要把软件id一禁用，照样倒闭。
        无比懊恼。
        复您说对了
        家园 你这就是不懂瞎说
        超算软件绝大部分开源，反过来说，商业软件在超算上面跑得快的还真不多。。。
        复你这就是不懂瞎说
        家园 当看到开源两字的时候。。。就不用再多讨论了
        明显，你既没有在工业界的真实经验，也没有在军工界的真实经验。
        最多，就是在学术圈子里，所以才如此推崇开源，迷信开源。
        复当看到开源两字的时候。。。就不用再多讨论了
        家园 同意，工业界一般不会用开源的；军工界更不会用开源的；
        商业公司，采用开源，尤其是创业公司；
        复当看到开源两字的时候。。。就不用再多讨论了
        家园 del
        del
        复 del
        家园 得罪了，抱歉
        这里又不是你好我好大家好的地方。
        好歹也是因为想有所收益有所学习才会来这里的。
        我说错的地方，敬请指出来。我错了，我应该会改之。至少在西西河，似乎我还不是一个有错不改死要面子的人: 在网上要面子，有意思么？
        我说对的地方，你喜欢，则送一朵花。你欣赏，则加一个宝。你不喜欢，绕道就是了。
        好么。
        复得罪了，抱歉
        家园 交浅言深
        是我多嘴了。
        复交浅言深
        家园 谢谢你 :-)
        复当看到开源两字的时候。。。就不用再多讨论了
        家园 莫名其妙，俺说了半句开源好或是坏嘛
        俺说的就是一个客观事实：最好的超算在学术圈，而学术圈的超算以开源软件为主，别用商业软件的逻辑来套超算。。。
        复莫名其妙，俺说了半句开源好或是坏嘛
        家园 俺没有说开源好，或不好。。。只是。。。
        工业圈：消费级工业圈，工业级工业圈，轻工业圈，重工业圈，军工工业圈。。。
        所谓最好的超算在学术界，我只能呵呵两个字。
        你太迷信学术两个字了。我只是想说，学术，追求的价值取向，与工业是不同的。
        什么时候你明白这一点了，再来看所谓的开源，所谓最好。

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明