作者:Sanjay Ghemawat
          Howard Gobioff
          Shun-Tak Leung
翻译:tinyfool

5.3 诊断工具

广泛而详尽的分析日志,在问题隔离,调试,性能分析等方面对我们的帮助无法估量,与此同时它几乎没有开销。没有日志,我们很难理解短暂的不重复的机器之间的交互。GFS的服务器们生成许多事件(例如,块服务器启动和当机)以及所有的RPC(译注:远程进程调用)请求和回复。这些分析日志即使被删除也不会影响系统的正确运转。然而,我们尽量保存这些日志,直到达到空间极限。

RPC日志包含了除了读写的文件数据本身以外的线上传输的所有详细的请求和回应。通过匹配请求与回应,收集不同机器的RPC记录,我们可以重建整个通信历史来分析问题。日志还用来跟踪负载测试和性能分析。

日志对性能的影响很小(原小于带来的好处),因为这些日志是顺序和异步的。最近的时间保存在内存中,可用于连续的在线监控。


<< 5.2 数据完整性 | 6. 测量 >>