使用 Go-Colly 抓取时删除空行

我从 Go 开始,并从 Colly 开始。有人可以帮我从输出中删除空行吗?这是我的代码:


package main


import (

    "fmt"


    "github.com/gocolly/colly"

)


func main() {

    c := colly.NewCollector()

    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {

        fmt.Println(e.Text)

    })

    c.Visit("https://www.olx.pl/elektronika/gdynia/")

}

我试过这个:golang regexp remove all blank lines 和这个:Golang idiomatic way to remove a blank line from a multi-line string,可能是错误的方式,或者我错过了其他东西。


莫回无
浏览 111回答 2
2回答

ABOUTYOU

好吧,看起来空行并不是真正的空行,scraper 只是没有打印 DOM 中的元素,这就是为什么我看到抓取的文本之间有这么多的空白。通过告诉刮板我想要刮掉的子元素的特定定位器,这个问题得到了解决。

qq_笑_17

我认为您可以尝试标准化空间。func StandardizeSpaces(s string) string {    return strings.Join(strings.Fields(s), " ")}func main() {    c := colly.NewCollector()    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {        fmt.Println(StandardizeSpaces(e.Text))    })    c.Visit("https://www.olx.pl/elektronika/gdynia/")}
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Go