猿问

Java HTTP Client 抓取网页,这个网页无论用什么编码都是乱码?

代码 大概是这样 ,采集其他网页没有问题 

 

................

             client.executeMethod(get);
            //
            String statusText = get.getStatusText();
            //System.out.println("Test.main():--->" + statusText);
            System.out.println("Test.main():--->" + new String(get.getResponseBodyAsString().getBytes("GB2312"), "UTF-8"));
            InputStream in = get.getResponseBodyAsStream();
            BufferedReader br = new BufferedReader(new InputStreamReader(in, charset));
            String tempbf;
            html = new StringBuffer(100);
           ........................
红糖糍粑
浏览 520回答 5
5回答

ABOUTYOU

谢谢,其实是网页使用的GZIP压缩,使用GZIPInputSteam接收就可以了

动漫人物

@assasszt: 确实,以前貌似有人也遇到过。

繁星淼淼

推荐看一下这个系列博文: Java中文乱码解决之道
随时随地看视频慕课网APP

相关分类

Java
我要回答