猿问

如何编写一个简易的node爬虫获取任意网址的title呢?

方法的参数为url 然后 返回值为 title。


如:


function getTitle(url){

 .......

 return title

}

getTitle('http://www.baidu.com')  


得到 "百度"


getTIttle('http://www.126.com') 


得到 "网易邮箱"


如何写一个方法获取任意网址的title呢?


长风秋雁
浏览 1136回答 6
6回答

慕的地10843

纯前端使用ajax或者iframe都会存在跨域问题。需要服务端进行请求指定地址,获取到地址对应的页面,然后提取出title标签中内容。

沧海一幻觉

使用superagent+cheeriosuperagent.get(url)    .end((err, res) => {        const $ = cheerio.load(res.text)        console.log($('title').text())    })

蝴蝶不菲

获取任意网址的html页面,获取页面中<title>标签里面的内容。如果想封装成一个方法,那就将不同的功能分别写成函数,依次调用。

慕森卡

需要通过ajax获取指定url的页面内容,然后再从中分析出其标题

拉莫斯之舞

任意是做不到的,因为有的网站对cookie有要求,不符合的话是直接403的。对于没有验证要求的网站,最基本的使用http.get获取html再解析即可。解析可以用正则或者cheerio
随时随地看视频慕课网APP

相关分类

JavaScript
我要回答