继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

QueryList 抓取齐装网数据导入Excel

xiaohai888
关注TA
已关注
手记 6
粉丝 1
获赞 0
<?php
require 'vendor/autoload.php';

use QL\QueryList;

header('Content-type:text/html;charset=utf-8');


$offset=1;
for($i=1;$i<=33;$i++){

    $url = "http://bj.qizuang.com/company/?p=".$offset;
    $html = file_get_contents($url);
    //采集规则
    $rules = [
        //采集a标签的href属性
        'url' => ['.company-link','href','',function($content){
            return $content;
        }],
    ];
    $ql = QueryList::html($html)->range('.new-box-l>ul>li')->rules($rules)->query();
    $data = $ql->getData();
    foreach ($data->all() as $key => $val) {
        getContents($val['url']);
    }
    $offset+=1;
    echo "弟".($i+1)."页完成".PHP_EOL;
}

function getContents($url){
    $html = file_get_contents($url);
    //采集规则
    $rules = [
        //采集a标签的href属性
        'title' => ['.com-tit','text'],
        'logo'  => ['.c-mark img','src'],
        'address'  => ['.att','text'],
        'telphone'=>['.tel','text'],
        'mobile'=>['.mob','text'],
    ];
    $ql = QueryList::html($html)->rules($rules)->query();
    $data = $ql->getData();
    $data = $data->first();
    
}


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP