继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

进击Node.js基础(一)网络爬虫

梵天001
关注TA
已关注
手记 4
粉丝 5
获赞 38
var http = require('http');
var cheerio = require('cheerio');
var url = 'http://www.imooc.com/video/7965';  //本网页的课程列表抓取

/*
filterChapters过滤
 */
function filterChapters(html) {
    var $ = cheerio.load(html);
    var chapters = $('.nano-content').children();
    var courseData = [];

    chapters.each(function(item) {
        var chapter = $(this);
        var chapterTitle = chapter.find('.sec-title').text();
        var videos = $(this).children('li');
        var chapterData = {
            chapterTitle: chapterTitle,
            videos: []
        };

        videos.each(function(item) {
            var video = $(this);
            videoTitle = video.find('a').text();
            videoId = video.find("a").attr('href') ? video.find("a").attr('href').split("/")[2] : ''
            chapterData.videos.push({
                title: videoTitle,
                id: videoId
            });
        });
        courseData.push(chapterData);
    });

    return courseData;
}
/*
打印内容
 */
function printCourseData(courseData) {
    courseData.forEach(function(item) {
        item.videos = item.videos.slice(1); //第一个是空的,去掉
        var chapterTitle = item.chapterTitle;
        console.log(chapterTitle + '\n');
        item.videos.forEach(function(item) {
            console.log('【' + item.title + '】,【' + item.id + '】');
        });
    });
}

http.get(url, function(res) {
    var html = '';
    res.on('data', function(data) {
        html += data;
    });

    res.on('end', function() {
        var courseData = filterChapters(html);
        printCourseData(courseData);
        console.log('it\' done!');
    })
}).on('error', function() {
    console.log('error');
});
打开App,阅读手记
13人推荐
发表评论
随时随地看视频慕课网APP