脚本无法从重定向的 url 解析标题

我用 selenium 在 python 中编写了一个脚本来从网页中获取标题地址。我在脚本中使用的 url 会在几秒钟内自动重定向。这是我的脚本遇到错误的地方。我正在粘贴该错误的一部分以给您一个想法。


ConnectionResetError: [WinError 10054] An existing connection was forcibly closed by the remote host


During handling of the above exception, another exception occurred:

我试过的脚本:


from contextlib import closing

from selenium import webdriver

from selenium.webdriver.support import ui


url = "https://www.rightmove.co.uk/propertyMedia/redirect.html?propertyId=30578943&contentId=1625965454&index=1"


with closing(webdriver.Chrome()) as wd:

    wait = ui.WebDriverWait(wd, 10)

    wd.get(url)

    item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title")).text

    print(item)

这是我希望从该页面获得的输出:


Park View Back Road, Locharbriggs, Dumfries, DG1

这是我在该错误之前看到的:

http://img3.mukewang.com/610bb8dc0001a59c04730546.jpg

holdtom
浏览 221回答 1
1回答

天涯尽头无女友

你可能需要更换item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title")).text这意味着等待特定元素出现在 DOM 中并立即获取其当前可见的文本(可能返回空字符串)和item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title").text)这意味着等待特定元素并在它不是空字符串时返回其可见文本但恕我直言,你可以简单地做item = driver.find_element_by_css_selector("h1.header_address__title").get_attribute('textContent')获取文本值,即使该文本当前未显示在页面上至于您的chromedriver that stops working问题:尝试将Chrome和chromedriver都更新到最新版本
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python