我正在尝试使用 python、beautiful soup 和 selenium 从实用网站抓取数据。我试图抓取的数据是这样的:时间、原因、状态等。当我运行典型的页面请求时,解析页面并解析我正在寻找的数据(id="OutageListTable" 中的数据) ,然后打印出来,div 和字符串无处可寻。当我检查页面元素时,数据就在那里,但它在 flex 容器中。
这是我正在使用的代码:
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
import urllib3
from selenium import webdriver
my_url = 'https://www.pse.com/outage/outage-map'
browser = webdriver.Firefox()
browser.get(my_url)
html = browser.page_source
page_soup = soup(html, features='lxml')
outage_list = page_soup.find(id='OutageListTable')
print(outage_list)
browser.quit()
您如何检索 flex/flexbox 容器中的信息?我没有在网上找到任何资源来帮助我解决这个问题。
慕哥6287543
BIG阳
相关分类