python3用urllib爬网页,为什么得到的html只有上半部分?

python版本3.7.0
在使用urllib爬虫获取网页html代码时,编码时报错,忽略掉错误。

html = data.decode(charset,errors='ignore')

得到的html只有上半部分。

https://img1.mukewang.com/5b4b460c0001370008000163.jpg

而网页本应该已</html>结尾的。

https://img.mukewang.com/5b4b46160001c00305260178.jpg

就是说丢失了一部分。
请问各位大神这是什么情况?
网上都搜不到结果。难道就我一个人遇到吗?
话说python写爬虫确实快,但我刚开始都踩了好几个坑了。


浮云间
浏览 471回答 2
2回答

哆啦的时光机

是不是爬的内容太大了。vscode默认只显示一定大小内的

有只小跳蛙

是vs code的问题,换了调试环境就好了。看来vs code还是不能做开发环境用。
打开App,查看更多内容
随时随地看视频慕课网APP