我想在动态 href 上循环。事实上,我每页下载一组文件。在每个页面上,我下载了 100 个文本文件,但我必须下载 200 000 个文件。所以,我必须在 2000 中点击 next 按钮。为此,我得到了 next 按钮的 href 地址,但不幸的是,此链接中的两个对象发生了变化,页码 1,2,3 等和一串人物。请参阅随附的下一个更改按钮的示例。
https://search.proquest.com/something/E6981FD6D11F45E8PQ/2?accountid=12543#scrollTo
https://search.proquest.com/something/E6981FD6D11F45E8PQ/3?accountid=12543#scrollTo
https://search.proquest.com/something/61C27022597C4092PQ/4?accountid=12543#scrollTo
https://search.proquest.com/something/E431552DC6554BF7PQ/5?accountid=12543#scrollTo
我是 Python 的新用户。我的水平很差。
#Before I add selenium setup for scraping.
n=2000
for i in range(1,n):
href="https://search.proquest.com/something/715376F5A5AF44BBPQ/" + str(i) + "?accountid=12543#scrollTo"
driver.get(href)
#Here, I add the code which allows downloading for each page.
收到一只叮咚
肥皂起泡泡
相关分类