我正在尝试从网站上的许多跨度标签下抓取一些文本,但没有获得干净的文本,任何帮助将不胜感激!
这是网址:
https://www.example.com
这就是我正在尝试的
response.xpath('//div[@class="agency-header__address"]').extract_first()
预期输出:
Level 18, 25 Bligh Street, SYDNEY, NSW 2000
摇曳的蔷薇
万千封印
相关分类