淘客熙熙

主题:中国成功研制千万亿次超级计算机“天河一号” -- kernelh

共:💬21 🌺16 新:
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 手上有个做Monte Carlo差事

用哪种机器比较好呢。我现在准备上Grid,比较成熟,但数据交换量很大,许多历史数据要送来送去,正犯愁呢。

家园 不光是软件的问题

使用MPI类的并行工具,如果一个节点在计算中死掉,则结果必须全部重算。一次使用上千CPU,很难保证所有节点和其链接链路在足够长的时间内不死。当然,这个问题也可以转化成软件问题,即在软件设计中加入checkpoint机制。但是不是所有算法都有好的checkpoint机制可实现的。

而海量数据计算则没有这个问题。单个节点的故障可以由重新提交该节点正在计算的任务来解决。只要把任务划分到适当大小(一般是单个节点运行5-30分钟),整个集群相当于一个高可靠计算平台。

家园 如果数据是一次送达,可以用grid

如果运算过程中节点之间不停交换新生成的数据,最好用超级计算机。

一般来说,如果可以把大任务划分成大量的“读数据-->运算-->写数据”这样的小任务,都可以用grid,而且用grid比用超级计算机容易得多。能用grid的尽量不要用超级计算机。

家园 效率怎么这么低?

每秒钟1206万亿次的峰值速度和每秒563.1万亿次的Linpack实测性能

并行效率连50%都不到,这个实在是不能算petaflops...这到底是怎么搞的?谁找得到详细的内容么?

家园 天河是异构的,cpu加显卡算的

显卡做通用计算还不像cpu那么成熟。

家园 看这里:

http://we.pcinlife.com/viewthread.php?tid=1285934&extra=&page=1

全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河