我之前遇到过这个问题,你解决了没有,解决了麻烦告诉我一声,写啦
以前用python做过模拟登录。首先,爬取登录页面html,保持会话;使用xpath或正则匹配获取验证码图片url,将图片保存在本地,利用python第三方图像库将验证码图片显示出来,然后手动输入验证码,再将登录数据post,就可以登录成功了。
这个就是验证一下是机器还是人的交互
使用正则
curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, 0);
跳过https验证
echo str_replace('屌丝', '首页', $output);
请问大概是怎么解决的?我也遇到这种问题,不知道怎么入手解决
结果是一样的,只是firebug格式化了的json数据而已
能用就可以,不影响吧
php -f D:\wamp\www\learn\curl\baidu.php > D:\wamp\www\learn\curl\baidu.html 。要这样吧。你不加绝对路径会保存在当前路径的吧
不是要自己设置 cookie的具体内容,是要设置 cookie 的存储和读取的文件名
这个就太广了,爬这些的话用python效率更高一点
header("content-Type: text/html; charset=utf-8");
这是一个php接口哦,因为执行失败了,所以没有页面输出,在登录之后 抓取页面之前也有一个页面 可以输出那个页面看看 对应的json数据,
soap 的接口要用soap方式
什么叫用命令行抓取?老师的操作是,抓取在代码中,用命令行执行负责抓取的文件
你在php文件中,运行下phpinfo();看看输出的PHP信息里边有没有curl这个扩展,如果没有,需要安装一下。
是的额
后面的课程有Ftp相关的内容
多传了个 验证码,对比服务器验证码。
或者通过 Ajax 先提交验证码验证是否正确。
没有吧
没有安装对扩展? 不知道你具体在说什么
成功时返回 TRUE , 或者在失败时返回 FALSE 。 然而,如果 CURLOPT_RETURNTRANSFER 选项被设置,函数执行成功时会返回执行的结果,失败时返回 FALSE 。
使用localhost访问就可以