猿问

nodejs怎么爬post请求?

1、爬虫: nodejs怎么爬ajax的post请求的异步加载的内容?

一个页面异步加载新出的内容怎么抓取?
一般的get请求: www.xxxx.com/page=xxx
get请求可以通过page+1这样加。比如控制页数,抓10页
get异步请求
比如张大妈的发现

http://faxian.smzdm.com/json_more?type=new&timesort=1487861419

通过前几页,替换计算最后一个数字,实现抓取N页情况

2、post方式

而post请求,比如知乎的,一个问题下,‘更多’那个button是个post请求

https://www.zhihu.com/node/QuestionAnswerListV2

post也有url,但是无参数,直接访问可能就404。

我尝试过分析 response返回的 json字符,

{"r":0, "msg": (里面是新增的div的html代码,没有规律)
}

3、请问第2点说的post方式有没有办法抓?


汪汪一只猫
浏览 385回答 1
1回答
随时随地看视频慕课网APP

相关分类

JavaScript
我要回答