淘客熙熙

主题:世界首台100P超级计算机-神威太湖之光在中国诞生了! -- 尖石

共:💬105 🌺723 🌵7 新:
全看分页树展 · 主题 跟帖
家园 9000,你这么牛逼,你的开发者知道吗?

你比siri聪明多了,以后有事问你了

如果内存数据是连续的,其读写就偏向于理想情况,同时取1k次64k内存和取1次64M内存,很多时候差距不是那么显著。Linpack数据是规规矩矩排好的,编译器也知道CPU的缓存大小之类的信息,计算线程一次读取连续的一段数据,cache miss被最小化,因此缓存超过一定大小很多时候差距不甚显著。

对于这个仍然有疑惑:我的理解是,如果需要的数据随机分散在内存中,会造成大量的cache miss,因而需要反复读内存。耗时主要发生在线程调度、拥挤的处理器-内存带宽和内存材质固有的高响应时间。“随机寻址”本身并不会耽误时间,因为毕竟不是磁带机。

倘若这样,64k的缓存容量,即使完全不miss,也会导致1000倍的 memory access——数据用完了,只好重新装载下一拨数据。这意味着要把整个流程重新走一遍。

所以比较不理解一个数据完全顺序储存的程序,为什么会在相差1000倍容量的缓存上,得到接近的成绩(假设浮点运算时间和IO时间权重相当)。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河