Selenium 和 Python，从 HTML 正文中获取没有任何标签的文本

首页课程实战体系课手记专栏慕课教程

需要使用 Selenium 和 Python 在标签之间获取句子：

<h2 id='PO-PF2' class="section">Program Information</h2>

Length: Two-year Ontario College Graduate Certificate program

<br />Delivery Sequence:<br />

使用 find_element_by_xpath在不同的变化并没有返回任何结果。

使用driver.find_element_by_tag_name("body").text然后解析它以获取所需的句子，但还有其他方法吗？

预期结果：长度：两年安大略大学研究生证书课程

更新：

'(?<=Length:)([\s\S]*?)(?=\n)'

涵盖所有需要的案例

MYYA

浏览 575回答 1

陪伴而非守候

您可以在此处使用正则表达式：(?=Length)(.*)(?<=program)(?=...) 断言可以在此处匹配给定的子模式，而无需消耗字符(?<=...) 确保给定的模式匹配，在表达式中的当前位置结束。图案必须有固定的宽度。不消耗任何字符

0 0

随时随地看视频慕课网APP