作者:Sanjay Ghemawat
          Howard Gobioff
          Shun-Tak Leung
翻译:tinyfool

6.3.2 块服务器负载

表4展现了数据大小和操作分布程度的关系。读取的分布情况呈现出两个高峰。小的读取操作(64KB以下)来自位置查询操作集中的客户机,它们在巨大文件中寻找小块的数据。大的读取(超过512KB)来自对整个文件的长连续读取。

在集群Y中有大量的读取操作完全不返回数据。我们的程序,尤其是在产品系统里,经常使用文件作为生产者-消费者对列。生产者持续的追加文件而消费者读取文件的尾部。偶尔的,不返回任何数据,因为消费者的速度超过了生产者。集群X中很少出现这种情况,因为它通常用于短期存在的数据分析任务,而不是长期存活的分布应用程序。

写尺寸也呈现双峰分布。大块的写(超过256KB)通常来自写入者的缓冲。


<< | >>