猿问

python爬虫如何获取动态的table内容?浏览器显示点击无get和其他网络请求

我想爬取下面这个网站的ip列表
https://free-proxy-list.net/

因为每一页都会更新ip,所以需要翻页,一开始用selenium做,可以弄,可是觉得成本太大。所以想用requests弄。

点击了那个 next 按钮控件,在浏览器的监视器的network里,发现没有JavaScript执行。也没有数据被传输。看了下那些控件,比如那个first

<li class="fg-button ui-button ui-state-default first" id="proxylisttable_first"><a href="#" aria-controls="proxylisttable" data-dt-idx="0" tabindex="0">First</a></li>

感觉好像是通过aria-controls来更新table的,可是我查了下,完全没有头绪。如果没有从服务器get数据,那么数据应该是保存在哪里了?搜了下html文件,发现似乎也没有其他页面的ip数据。


繁花如伊
浏览 535回答 1
1回答

慕莱坞森

不如看看源码?所有的内容都在源码中~
随时随地看视频慕课网APP

相关分类

Html5
我要回答