作者:Sanjay Ghemawat
          Howard Gobioff
          Shun-Tak Leung
翻译:tinyfool

6.3.1 方法论和警告

这些结果只包括客户机发出的请求,它们可以反映出我们程序在整个文件系统产生的工作负担。它们不包括哟那股承载客户机请求的服务器间请求,也不包括内部的后台活动,例如转发的写操作,以及负载均衡的操作。

I/O操作的统计信息基于那些利用真实的GFS服务器记录的RPC请求日志重建的信息。例如,GFS客户机代码可能把一个读操作分成几个RPC请求来提高并行性。因为我们的访问高度程式化,我们希望任何错误都包含在噪声内。更详尽的日志可能提高数据的准确性,但是不太可能为了这个去重新编译和重新启动数千个正在运行的客户机,收集那么多机器的结果太过麻烦。

小心不要太过于概括我们的工作负载。因为Google完全控制GFS和应用程序,所以应用程序都为GFS优化,而同时GFS也是为这些应用程序设计的。这样的相互作用可能也存在于一般程序和文件系统中,但是它们的影响显然没有我们的案例那么严重。


<< 6.3 负载故障 | 6.3.2 块服务器负载 >>