主题：世界首台100P超级计算机-神威太湖之光在中国诞生了！ -- 尖石

共:💬105 🌺723 🌵7 新:

9000，你这么牛逼，你的开发者知道吗？

你比siri聪明多了，以后有事问你了

如果内存数据是连续的，其读写就偏向于理想情况，同时取1k次64k内存和取1次64M内存，很多时候差距不是那么显著。Linpack数据是规规矩矩排好的，编译器也知道CPU的缓存大小之类的信息，计算线程一次读取连续的一段数据，cache miss被最小化，因此缓存超过一定大小很多时候差距不甚显著。

对于这个仍然有疑惑：我的理解是，如果需要的数据随机分散在内存中，会造成大量的cache miss，因而需要反复读内存。耗时主要发生在线程调度、拥挤的处理器-内存带宽和内存材质固有的高响应时间。“随机寻址”本身并不会耽误时间，因为毕竟不是磁带机。

倘若这样，64k的缓存容量，即使完全不miss，也会导致1000倍的 memory access——数据用完了，只好重新装载下一拨数据。这意味着要把整个流程重新走一遍。

所以比较不理解一个数据完全顺序储存的程序，为什么会在相差1000倍容量的缓存上，得到接近的成绩（假设浮点运算时间和IO时间权重相当）。

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友