我是 Selenium 的新手,需要抓取一个网站,其中包含一个结构完全如下的链接列表:
<a class="unique" href="...">
<i class="something"></i>
"Text - "
<span class="something">Text</span>
</a>
<a class="unique" href="...">
<i class="something"></i>
"Text - "
<span class="something">Text</span>
</a>
...
...
我需要在循环内单击此链接列表并从结果页面中抓取数据。到目前为止我所做的是:
lists = browser.find_elements_by_xpath("//a[@class='unique']")
for lis in lists:
print(lis.text)
lis.click()
time.sleep(4)
# Scrape data from this page (works fine).
browser.back()
time.sleep(4)
它适用于第一个循环,但当第二个循环到达时
print(lis.text)
它抛出一个错误说:
StaleElementReferenceException:消息:过时的元素引用:元素未附加到页面文档
我试过了print (lists),它提供了所有链接元素的列表,所以工作正常。当浏览器返回上一页时会出现问题。我试过延长时间并使用browser.get(...)而不是,browser.back()但错误仍然存在。我不明白为什么它不会打印,lis.text因为列表仍然包含所有元素的列表。任何帮助将不胜感激。
相关分类