在Python中解析HTML

如果我不能使用BeautifulSoup或lxml,解析HTML的最佳选择是什么?我有一些使用SGMLlib的代码,但它有点低级,现在已经弃用了。

我更喜欢它可能会造成一些格式错误的HTML,尽管我很确定大部分输入都会非常干净。


小唯快跑啊
浏览 479回答 3
3回答

吃鸡游戏

Python有一个原生的HTML解析器,但是尼克建议的Tidy包装器也可能是一个可靠的选择。Tidy是一个非常常见的库,(用C语写的是吗?)

尚方宝剑之说

您可以使用Pallet(MacPorts官方GUI)在Mac(OS X)上轻松无缝地安装lxml和许多其他python模块模块名称为py27-lxml。容易1,2,3。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python