我正在尝试从以下网站提取数据:
我的目标是八角形中的值“6”:
我相信我的目标是正确的 xpath。
这是我的代码:
import sys
import os
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from selenium import webdriver
os.environ['MOZ_HEADLESS'] = '1'
binary = FirefoxBinary('C:/Program Files/Mozilla Firefox/firefox.exe', log_file=sys.stdout)
browser = webdriver.PhantomJS(service_args=["--load-images=no", '--disk-cache=true'])
url = 'https://www.tipranks.com/stocks/sui/stock-analysis'
xpath = '/html/body/div[1]/div/div/div/div/main/div/div/article/div[2]/div/main/div[1]/div[2]/section[1]/div[1]/div[1]/div/svg/text/tspan'
browser.get(url)
element = browser.find_element_by_xpath(xpath)
print(element)
我可以看到问题是由于不正确的 xpath 造成的,但无法弄清楚原因。
我还应该指出,我认为使用 selenium 是抓取该站点的最佳方法,并打算提取其他值并在多个页面上针对不同股票重复这些查询。如果有人认为 BeutifulSoup、lmxl 等我会更好,那么我很高兴听到建议!
提前致谢!
繁花如伊
LEATH
qq_笑_17
相关分类