猿问

在C#中解析html的最佳方法是什么?

在C#中解析html的最佳方法是什么?

我正在寻找一个库/方法来解析一个html文件,它比一般的XML解析库具有更多的html特定特性。



RISEBY
浏览 2142回答 3
3回答

梦里花落0921

您可以使用TidyNetTidy将HTML转换为XHTML,然后使用XML解析器。另一种选择是使用内置引擎mshtml:using mshtml;...object[] oPageText = { html };HTMLDocument doc = new HTMLDocumentClass();IHTMLDocument2 doc2 = (IHTMLDocument2)doc; doc2.write(oPageText);这允许您使用类似javascript的函数,如getElementById()

慕容708150

HTML敏捷包这是一个敏捷的HTML解析器,它构建了一个读/写DOM,并支持普通的XPath或XSLT(您实际上不需要理解XPath或XSLT就可以使用它,不要担心.)。它是一个.NET代码库,允许您解析“走出Web”HTML文件。解析器对“真实世界”格式错误的HTML非常宽容。对象模型与System.Xml非常相似,但适用于HTML文档(或流)。
随时随地看视频慕课网APP
我要回答