猿问
hadoop读取GBK编码文件,中文乱码问题求助?
hadoop读取GBK编码文件,中文乱码问题求助
宝慕林4294392
浏览 1300
回答 1
1回答
MMMHUHU
1、hadoop内部默认的文本读取编码设置为utf-8,你的源文件为gbk,在读取时遇到中文时是肯定要出现乱码。解决方法有二:(1)将你的GBK编码的文件在生成时,统一成utf-8,这是最好的方式,方便国际化。(2)重写一个你的hadoop读文件的FileInputFormat对象,在其中进行传相应的编码值与编码转换的工作,这个是比较麻烦,实际当中用得很少。
0
0
0
随时随地看视频
慕课网APP
相关分类
Hadoop
怎么将hadoop从2.6换为2.7?
1 回答
hadoop有什么用?
1 回答
我要回答