好吧,我卡住了。我使用 selenium 和 PhantomJS 制作了一个小的网页抓取 python 脚本。我正在处理的页面在 iframe 文档中包含我想要的数据,但我的 Web 驱动程序未运行。
<main Page Heads etc>
<blah>
<iframe 1 src="src1" ... etc etc>
#document
<tag>
<tag>
<iframe2 src="src2"><iframe2>
<iframe1>
<blah>
<end of webpage DOM>
我想得到src的iframe2. 我尝试src1通过我的网络驱动程序运行 URL,但我得到的只是原始页面 html,而不是加载的网页元素,iframe2必须由内部的某个脚本创建iframe1,但我无法让我的网络驱动程序运行该脚本。
有任何想法吗?
这是我在网页上运行 javascript 来获取编译后的页面 DOM 的方法:
from selenium import webdriver
self.driver = webdriver.PhantomJS()
self.driver.get(url)
page = self.driver.page_source
soup = BeautifulSoup(page,'html.parser')
湖上湖
相关分类