我正在尝试收集列出的待售房屋的所有 href 链接,但是当我运行我的程序时,我得到了一个大约 50 个的列表,尽管这远远高于此单页上列出的房屋数量/href 链接(url)。
url我已经尝试查看页面的源代码并交叉引用我的程序的结果,虽然有些是匹配的,但有些在网站页面 ( )上找不到。
import requests
from bs4 import BeautifulSoup as bs
url='https://www.rightmove.co.uk/property-for-sale/find.html?searchType=SALE&locationIdentifier=REGION%5E1091&insId=1&radius=0.0&minPrice=&maxPrice=&minBedrooms=&maxBedrooms=&displayPropertyType=&maxDaysSinceAdded=&_includeSSTC=on&sortByPriceDescending=&primaryDisplayPropertyType=&secondaryDisplayPropertyType=&oldDisplayPropertyType=&oldPrimaryDisplayPropertyType=&newHome=&auction=false'
Web_Page = requests.get(url)
Soup = bs(Web_Page.text,'html.parser')
Web_Section_Of_Interest= Soup.find_all('a',class_="propertyCard-link")
count=0
for item in Web_Section_Of_Interest:
print('https://www.rightmove.co.uk'+item.get('href'))
count+=1
print(count)
我得到了 50 个 href 链接的列表
url但我期待一个与网页上列出的房屋数量相匹配的列表,即25。
暮色呼如
胡说叔叔
相关分类