python版本3.7.0在使用urllib爬虫获取网页html代码时,编码时报错,忽略掉错误。
html = data.decode(charset,errors='ignore')
得到的html只有上半部分。
而网页本应该已</html>结尾的。
就是说丢失了一部分。请问各位大神这是什么情况?网上都搜不到结果。难道就我一个人遇到吗?话说python写爬虫确实快,但我刚开始都踩了好几个坑了。
哆啦的时光机
有只小跳蛙