主题：【原创】从超算的发展看中国科技的进步---神威蓝光的问世 -- ★kg90

共:💬49 🌺173

看起来不错

[email protected]/16Core，就是8浮点运算/核/周期。现代RISC应该都是多发射，目前的话肯定要上到4发射了。这样的话，运算通道是128位的SIMD，每次处理2个浮点数。这些数据和目前CPU架构的常用设置可以匹配得上。

不过，要把16*8个128位浮点SIMD放到一个芯片，这怕是有点变态吧。再加上互连，这得多大的芯片面积啊，除非大大降低缓存容量。这样，对linpack可能影响不大，但对稍复杂的任务，性能影响就大了。

另外，SIMD/4发射/16核这些都是影响并行效率的因素，在这么多因素影响下还有这么高的效率，编译软件上是不是做了什么手脚却悄悄地不说？这要真有，可比硬件的进步还令人振奋。

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友