您如何在vb.net中解析HTML

您如何在vb.net中解析HTML

我想知道是否有一种简单的方法可以解析vb.net中的HTML。我知道HTML并不是XML的严格子集,但是如果可以这样处理的话,那就太好了。是否有什么可以让我在VB.net中以类似XML的方式解析HTML的?



饮歌长啸
浏览 1371回答 3
3回答

米琪卡哇伊

'也添加编引用:Microsoft.mshtml然后在页面上:Imports mshtmlFunction parseMyHtml(ByVal htmlToParse$) As String     Dim htmlDocument As IHTMLDocument2 = New HTMLDocumentClass()     htmlDocument.write(htmlToParse)     htmlDocument.close()     Dim allElements As IHTMLElementCollection = htmlDocument.body.all    Dim allInputs As IHTMLElementCollection = allElements.tags("a")     Dim element As IHTMLElement    For Each element In allInputs         element.title = element.innerText    Next     Return htmlDocument.body.innerHTMLEnd Function如在这里找到:

qq_花开花谢_0

如果您的HTML遵循XHTML标准,则可以使用System.XML命名空间类进行很多解析和处理。另一方面,如果您要解析的是Web开发人员称为“标签汤”的内容,则需要第三方解析器,例如HTML Agility Pack。如果您试图弄清楚浏览器在每个浏览器解析标记汤时会有不同的方式时将如何解释HTML,那么这可能只是部分解决您的问题的方法。
打开App,查看更多内容
随时随地看视频慕课网APP