wordcount的时候split阶段按照128M来拆分文件的话,把单词拆开了,那是不是就会统计有误差?

来源:2-2 从分片输入到Map

我想问问天

2019-09-05 22:31

split会把单词给拆开吗

写回答 关注

1回答

  • tqz啊
    2019-09-13 19:06:47

    不会,spilt 拆分的规则是代码里面你自己制定的,比如按照空格、逗号、制表符等。不可能将 hello 拆成 he 和 llo

Hadoop进阶

MapReduce原理,并实现简单的推荐

24208 学习 · 68 问题

查看课程

相似问题