我正在尝试使用 Golang xml 解析器解析 html 文档。我已经设法提取所有<li>元素,但如果元素包含链接<a>,则链接的内容将被忽略。我只想忽略嵌套<a>并将其内容显示为纯文本,但我不知道如何。
这是我的代码:
d := xml.NewDecoder(resp.Body)
d.Strict = false
d.AutoClose = xml.HTMLAutoClose
d.Entity = xml.HTMLEntity
type list_item struct {
Data string `xml:",chardata"`
}
for {
t,_ := d.Token()
if t == nil {
break
}
switch se := t.(type) {
case xml.StartElement:
if se.Name.Local == "li" {
var q list_item
d.DecodeElement(&q, &se)
c.Infof("%+v\n", q)
}
}
}
有没有办法忽略嵌套元素并显示其内容?
绝地无双
相关分类