老师,这个420M的文件是不是不一定是个完整的文件,而是一个文件在该DataNode中的部分,也可能在其他DataNode上也有该文件的数据?
Map阶段的输入如果是从HDFS读取的话,那么这个文件就会从多个DataNode读取,但最后读取的是一个完整的文件