我正在使用 Pythonlxml
库来解析 HTML。我有叶点,例如<a>
,想要获取其父级的文本。我尝试通过两种方式做到这一点:
.xpath('::parent*')
,
.getparent().text
.
from lxml.etree import HTML
text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'
parsed = HTML(text)
parsed.xpath('//a')[0].getparent().text
parsed.xpath('//a/parent::*')[0].text
我FIRST PART使用了任何一种方法,但是我怎样才能获得SECOND PART?
叮当猫咪
相关分类