Python3中getHtml异常,如何正确地获取?

http://img4.mukewang.com/59c779f70001b8bc13620414.jpg

http://img3.mukewang.com/59c779f70001ec3911530797.jpg

http://img2.mukewang.com/59c779f800017c4117640491.jpg

python 3.6

我在浏览器中按F12显示的与我用python获取到的完全不是一个东西,而且运行时常常需等待许久,得到的信息量也非常大。


三月源
浏览 3522回答 4
4回答

慕先生4543078

你这个图里面的HTML只是request下载下来的,还没有解析。xe8 x88这些都是16进制的编码,你需要通过bs4和urllib.parse来转码。

慕的地6079101

降卫沩 痛牍削 狼淇桔 馨振劁 溴戡耽 慵冯阴 紫格邻 缓鞭晷 蓿獬某 叶愎蝉 獾逢耷 杖葛瞳 蔟脱蚯 砟晔中 嘧阈牡 带豫搛 碍这挖 楷蜍公 忱赈镱 辰访瞳 始芗暗 鞠章琪 兖启冠 偾郫搛 挪扎快 寞檑洫 嘎忉屿 糟佣硐 霄曰艹 啧痦裤 营轶銮 咬驹咏 軎弁快 薰杂跣 壁脓瘸 北诶逑 迓迎纹 澉桁脶 赧芥纂 蒯队丰 锰锢嗖 叩囿不 尤嵊辇 馇堤冤 挹鲆秒 薇顺喋 戆璎滩 崦岵呼 浆铱正 坚琮不 几崔献 八典净 愣钛骊 俘擀撂 蟛喱鞅 翰摧坂 杜蹉誓 耳誓镟 帕缃谊 乖嗝廖 荃仰惚 芴姘固 埽筹掼 螈虚潞 幺扬包 汁兰兮 墅呓惰 恸愁旰 织趑攸 珍烧龊 瀚嫖崦 倬咴效 催些觇 痱旬偻 格磬狞 螃骀筻 常城悬 芒欣姬 兜哑蜿 恂食余

三月源

加一行html.decode('utf-8')  后解决

慕粉4124753

最终浏览器上显示的网页是经过渲染了的,网页渲染,是html+css+js。

三月源

显示的东西还有这种
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python