利用更多的计算机资源共同完成工作,将数据分割在大量的服务器上,并行的从多台服务器上获取数据,但是如果某一台宕机,就会发生错误,所以需要实现容错,实现容错的最有用的一种方式就是复制,但是一不小心就会不一致,这就需要额外的工作完成副本同步,但是这是以性能为代价的,这和本来的想法冲突了
通过分割成块(chunk),一个块64MB,通过master管理
GFS写文件: 由于Chunk可能发生宕机的错误,所以需要放一个最新版本号,在master中也需要如此,这样在客户端请求时,如果master中的版本号在Chunk中找不到,则最新的Chunk发生了宕机等错误,这样就很好的避免了获取错误的信息Chunk
test1