如何使用goquery从HTML页面获取简单文本?

我是 Go 的新手。我正在使用goquery从 HTML 页面中提取数据。但问题是我要查找的数据不受任何 HTML 标记的限制。它是<br>标签后的简单文本。我怎样才能提取它?


编辑:这是 HTML 代码。


<div class="container">

    <div class="row">

      <div class="col-lg-8">

        <p align="justify"><b>Name</b>Priyaka</p>

        <p align="justify"><b>Surname</b>Patil</p>

        <p align="justify"><b>Adress</b><br>India,Kolhapur</p>

        <p align="justify"><b>Hobbies&nbsp;</b><br>Playing</p>

        <p align="justify"><b>Eduction</b><br>12th</p>

        <p align="justify"><b>School</b><br>New Highschool</p>

       </div>

    </div>

</div>

由此我想要“Priyanka”和“12th”。


12345678_0001
浏览 276回答 2
2回答

陪伴而非守候

以下是你想要的:doc.Find(".container").Find("[align=\"justify\"]").Each(func(_ int, s *goquery.Selection) {&nbsp; &nbsp; prefix := s.Find("b").Text()&nbsp; &nbsp; result := strings.TrimPrefix(s.Text(), prefix)&nbsp; &nbsp; println(result)})在代码前面导入字符串。如果您需要完整的代码示例,请查看此处。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Go