Selenium 和 Python,从 HTML 正文中获取没有任何标签的文本

需要使用 Selenium 和 Python 在标签之间获取句子:


       <h2 id='PO-PF2' class="section">Program Information</h2>

        Length: Two-year Ontario College Graduate Certificate program

        <br />Delivery Sequence:<br />

使用 find_element_by_xpath在不同的变化并没有返回任何结果。


使用driver.find_element_by_tag_name("body").text然后解析它以获取所需的句子,但还有其他方法吗?


预期结果:长度:两年安大略大学研究生证书课程


更新:


'(?<=Length:)([\s\S]*?)(?=\n)' 

涵盖所有需要的案例


MYYA
浏览 569回答 1
1回答

陪伴而非守候

您可以在此处使用正则表达式:(?=Length)(.*)(?<=program)(?=...)&nbsp;断言可以在此处匹配给定的子模式,而无需消耗字符(?<=...)&nbsp;确保给定的模式匹配,在表达式中的当前位置结束。图案必须有固定的宽度。不消耗任何字符
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python