如何从该表格内容中获取链接（我猜它是 javascript）？（不含硒）

我试图从这些表格内容中获取 href，但在 html 代码中不可用。[edited @ 3:44 pm 10/02/2019] 我会每天抓取这个网站和其他类似的网站，并与“昨天”的数据进行比较。所以我得到了这个数据中的每日新信息。[/编辑]

我找到了一个类似（但更简单）的解决方案，但它使用 chromedriver（链接）。我正在寻找不使用 Selenium 的解决方案。

网站：http ://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D

如果您单击表格的第一部分（如下所示）

You will get to this site: http://web.cvm.gov.br/app/esforcosrestritos/#/enviarFormularioEncerramento?type=dmlldw%3D%3D&ofertaId=ODc2MA%3D%3D&state=eyJhbm8iOiJNakF4T1E9PSIsInZhbG9yIjoiTVRFPSIsImNvbXVuaWNhZG8iOiJNUT09Iiwic2l0dWFjYW8iOiJNZz09In0%3D

如何抓取第一个站点以获取它在表格中的所有链接？（去第二个“链接”）

当我使用 requests.get 时，它甚至没有得到表格的内容。有什么帮助吗？

link_cvm = "http://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D"

import requests

html_code = requests.get(link_cvm)

html_code.text

print(html_code)

qq_笑_17

浏览 134回答 1

1回答

牛魔王的故事

您进入的第二个页面是使用 jscript 动态加载的。您要查找的数据以 json 格式包含在另一个页面中。搜索一下，有很多关于此的信息，其中之一，例如，看到这个。在您的情况下，您可以通过以下方式获得它：import requestsimport jsonurl = 'http://web.cvm.gov.br/app/esforcosrestritos/enviarFormularioEncerramento/getOfertaPorId/8760'resp = requests.get(url)data = json.loads(resp.content)print(data)输出是该页面上的信息。

0 0

随时随地看视频慕课网APP