作者:Sanjay Ghemawat
          Howard Gobioff
          Shun-Tak Leung
翻译:tinyfool

6.2 真实的集群

现在我们审视Google正在使用的两个集群,它们具有一定的代表性。集群A通常用于研究和开发,被上百工程师使用。典型的任务是被人工初始化,然后运行数个小时。它读取从数MB到数TB的数据,转化或者分析数据,然后把结果写回到集群中。集群B主要用于产品的数据处理。任务持续更长的时间,持续生成和处理数TB的数据集,只有非常偶然的人工参与。在两个案例中,一个"任务"都包含了运行在多个机器上的多个进程,同时读取和写入多个文件。


<< 6.1.3 记录追加 | 6.2.1 存储 >>