1、爬虫: nodejs怎么爬ajax的post请求的异步加载的内容?
一个页面异步加载新出的内容怎么抓取?
一般的get请求: www.xxxx.com/page=xxx
get请求可以通过page+1这样加。比如控制页数,抓10页
get异步请求
比如张大妈的发现
http://faxian.smzdm.com/json_more?type=new×ort=1487861419
通过前几页,替换计算最后一个数字,实现抓取N页情况
2、post方式
而post请求,比如知乎的,一个问题下,‘更多’那个button是个post请求
https://www.zhihu.com/node/QuestionAnswerListV2
post也有url,但是无参数,直接访问可能就404。
我尝试过分析 response返回的 json字符,
{"r":0, "msg": (里面是新增的div的html代码,没有规律) }
3、请问第2点说的post方式有没有办法抓?
相关分类