由于我一直在试图弄清楚如何制作一个循环而我无法从其他线程中制作它,因此我需要帮助。我对此完全陌生,因此编辑现有代码对我来说很难。
我正在尝试从网站上抓取数据。这是我到目前为止所做的,但我必须“手动”插入页面。我希望它自动从 1 到 20 页以 zl/m2 为单位抓取价格,例如:
import requests
from bs4 import BeautifulSoup
link=("https://ogloszenia.trojmiasto.pl/nieruchomosci-mam-do-wynajecia/wi,100.html?strona=1")
page = requests.get(link).text
link1=("https://ogloszenia.trojmiasto.pl/nieruchomosci-mam-do-wynajecia/wi,100.html?strona=2")
page1 = requests.get(link1).text
link2=("https://ogloszenia.trojmiasto.pl/nieruchomosci-mam-do-wynajecia/wi,100.html?strona=3")
page2 = requests.get(link2).text
pages=page+page1+page2+page3+page4+page5+page6
soup = BeautifulSoup(pages, 'html.parser')
price_box = soup.findAll('p', attrs={'class':'list__item__details__info details--info--price'})
prices=[]
for i in range(len(price_box)):
prices.append(price_box[i].text.strip())
prices
我试过这段代码,但卡住了。我不知道我应该添加什么来一次从 20 页获取输出以及如何将其保存到 csv 文件。
npages=20
baselink="https://ogloszenia.trojmiasto.pl/nieruchomosci-mam-do-wynajecia/wi,100.html?strona="
for i in range (1,npages+1):
link=baselink+str(i)
page = requests.get(link).text
在此先感谢您的帮助。
拉风的咖菲猫
相关分类