如何从该表格内容中获取链接(我猜它是 javascript)?(不含硒)

我试图从这些表格内容中获取 href,但在 html 代码中不可用。[edited @ 3:44 pm 10/02/2019] 我会每天抓取这个网站和其他类似的网站,并与“昨天”的数据进行比较。所以我得到了这个数据中的每日新信息。[/编辑]

我找到了一个类似(但更简单)的解决方案,但它使用 chromedriver(链接)。我正在寻找不使用 Selenium 的解决方案。

网站:http ://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D

如果您单击表格的第一部分(如下所示)

http://img4.mukewang.com/62a7e7c70001daf513010621.jpg

You will get to this site: http://web.cvm.gov.br/app/esforcosrestritos/#/enviarFormularioEncerramento?type=dmlldw%3D%3D&ofertaId=ODc2MA%3D%3D&state=eyJhbm8iOiJNakF4T1E9PSIsInZhbG9yIjoiTVRFPSIsImNvbXVuaWNhZG8iOiJNUT09Iiwic2l0dWFjYW8iOiJNZz09In0%3D


如何抓取第一个站点以获取它在表格中的所有链接?(去第二个“链接”)


当我使用 requests.get 时,它甚至没有得到表格的内容。有什么帮助吗?


link_cvm = "http://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D"

import requests

html_code = requests.get(link_cvm)

html_code.text

print(html_code)


qq_笑_17
浏览 134回答 1
1回答

牛魔王的故事

您进入的第二个页面是使用 jscript 动态加载的。您要查找的数据以 json 格式包含在另一个页面中。搜索一下,有很多关于此的信息,其中之一,例如,看到这个。在您的情况下,您可以通过以下方式获得它:import requestsimport jsonurl = 'http://web.cvm.gov.br/app/esforcosrestritos/enviarFormularioEncerramento/getOfertaPorId/8760'resp = requests.get(url)data = json.loads(resp.content)print(data)输出是该页面上的信息。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python