淘客熙熙

主题:【原创】从超算的发展看中国科技的进步---神威蓝光的问世 -- ★kg90

共:💬49 🌺173
全看分页树展 · 主题 跟帖
家园 看起来不错

[email protected]/16Core,就是8浮点运算/核/周期。现代RISC应该都是多发射,目前的话肯定要上到4发射了。这样的话,运算通道是128位的SIMD,每次处理2个浮点数。这些数据和目前CPU架构的常用设置可以匹配得上。

不过,要把16*8个128位浮点SIMD放到一个芯片,这怕是有点变态吧。再加上互连,这得多大的芯片面积啊,除非大大降低缓存容量。这样,对linpack可能影响不大,但对稍复杂的任务,性能影响就大了。

另外,SIMD/4发射/16核这些都是影响并行效率的因素,在这么多因素影响下还有这么高的效率,编译软件上是不是做了什么手脚却悄悄地不说?这要真有,可比硬件的进步还令人振奋。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河