继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

2017.9.7日 慕课网爬虫

Autism丶
关注TA
已关注
手记 1
粉丝 0
获赞 1

var http=require('http');
var cheerio=require('cheerio');
var url='http://www.imooc.com/learn/348';

function filterChapters(html){
var $=cheerio.load(html);
var chapters=$('.chapter ');
var courseData=[];
chapters.each(function(item){
var chapter=$(this);
chapter.find('strong').find(':nth-child(n)').remove(); //使用此方法,将获取到的子节点的内容移除掉
var chapterTitle=chapter.find('strong').text().replace(/\s+/g,"");
var videos=chapter.find('ul').children('li');
var chapterData={
chapterTitle:chapterTitle,
videos:[]
}

    videos.each(function(item){
        var video=$(this).find('a');
        var len=video.text().replace(/\s+/g,"").length;

        var videoTitle=video.text().replace(/\s+/g,"").substr(0,len-4);
        var id=video.attr('href').split('video/')[1];
        chapterData.videos.push({
            title:videoTitle,
            id:id
        })
    })
    courseData.push(chapterData);
})
return courseData;

}
function printCourseInfo(courseData){
courseData.forEach(function(item){
var chapterTitle=item.chapterTitle;
console.log(chapterTitle+ '\n');
item.videos.forEach(function(video){
console.log('【'+video.id+'】'+ video.title+'\n');
})
})
}

http.get(url,function(res){
var html='';
res.on('data',function(data){
html+=data;
});
res.on('end',function(){
var courseData=filterChapters(html);
printCourseInfo(courseData);
});
}).on('error',function(e){
console.log(e);
});

打开App,阅读手记
1人推荐
发表评论
随时随地看视频慕课网APP