python爬虫页面数据和网页源代码数据不一致?

网页链接是 http://yanbao.stock.hexun.com...

要爬取的是

https://img2.mukewang.com/5bc35fe9000123af07720294.jpg

投票的比例,f12和页面的数据是一致的,

但是网页源代码和用requests的数据:

https://img.mukewang.com/5bc35ff500012ffe05140193.jpg

为什么两者不同,具体的应该怎么解决,页面的数字应该是实时的,这种情况应该如何抓取投票比例的数据呢?求问


慕田峪9158850
浏览 4610回答 2
2回答

阿晨1998

因为页面有些DOM是在js执行之后渲染出来的,你要在右键-页面源码这里看,才是浏览器拿到的页面源码。如果你要爬取的数据是js渲染得到的,那么有两种办法。一种是直接调用浏览器帮你执行js,拿到你希望拿到的数据。这个可以用selenium这个工具实现。另一种是你自己模拟js的执行过程,用python代码实现这段算法,拿到数据
打开App,查看更多内容
随时随地看视频慕课网APP