我正在编写一个爬虫来从某些页面中检索一些数据,如何构建它的逻辑对我来说非常清楚,但我对如何正确使用选择器感到非常困惑。
我想使用 colly 获取一些新闻的标题,我转到页面https://g1.globo.com/economia并检查了我要提取信息的标题 -> 单击检查 -> 复制选择器。
选择器是
正文 > div.glb-grid > main > div.row.content-head.non-featured > div.title > h1
我怎样才能把它正确地放在这行代码中?
detailCollector.OnHTML("body > div.glb-grid > main > div.row.content-head.non-featured > div.title > h1", func(element *colly.HTMLElement) {
fmt.Println(element.Text)
})
如何以 colly 可以理解的方式解析这个选择器的正确方法?我在 colly 文档中找不到与此相关的任何内容。
一只甜甜圈
相关分类