问答详情
源自:2-2 从分片输入到Map

wordcount的时候split阶段按照128M来拆分文件的话,把单词拆开了,那是不是就会统计有误差?

split会把单词给拆开吗

提问者:我想问问天 2019-09-05 22:31

个回答

  • tqz啊
    2019-09-13 19:06:47

    不会,spilt 拆分的规则是代码里面你自己制定的,比如按照空格、逗号、制表符等。不可能将 hello 拆成 he 和 llo