不知道各位爬虫过微博的页面么?今天我试了试,获取到的html内容居然不是我想要的!!全是js内容,我猜测微博是实用js文件加载内容的。
那么问题来了,我要怎么获取js加载后的页面内容呢?就是body里面的标签内容。
我使用的是nodejs,superangert、cheerio、express。望大神赐教,小弟感恩不尽。
潇潇雨雨
相关分类