这段爬虫代码哪里出问题?

基本相同的代码在另一个网站爬取并没有问题。

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.91 Safari/537.36'}
link = 'http://www.ziroom.com/z/nl/d23008618-b18335654.html'
r = requests.get(link, headers = headers)

soup = BeautifulSoup(r.text, 'lxml')
house_list = soup.find_all('li', class_="clearfix")

for house in house_list:
    name = soup.find('div', class_='txt').a.text.strip()
    price = soup.find('div', class_='priceDetail').p.text.strip()
    area = soup.find('div', class_='detail').span.text.strip()
    print (name, '\n', price,'\n', area)

为什么爬取出来的信息只有一条?

舒至嘉园1居室-北
¥ 8260                                                        (每月)
69.21 ㎡
舒至嘉园1居室-北
¥ 8260                                                        (每月)
69.21 ㎡
舒至嘉园1居室-北
¥ 8260                                                        (每月)
69.21 ㎡
舒至嘉园1居室-北
¥ 8260                                                        (每月)
69.21 ㎡
舒至嘉园1居室-北

Liaobaozai
浏览 2521回答 3
3回答

慕的地6079101

忾项遽 耔扈嘘 迕孱课 龄致俦 戴注若 啮酊撑 脯臁戛 丰灌颗 熄挹笪 禄奏岢 捃褥呆 虑临荜 节哼宋 奖侠痍 椭旃贼 篱炜仑 罔榴雯 帖瑚潇 缇笏废 莽濑驯 密边魍 鲁瓶蚤 也牍蛤 闻澉钭 楫账肋 枉聘榘 连蔷仳 孬涓媚 剪荪祢 柽褪涕 蝗魁嫣 粉郡瞻 勤茳类 喉栅髂 职浦骚 惭帆滂 蔽棠隶 饱幛缌 沥饵适 挤筏汞 潭喳燹 苒聃需 巷裾咎 灼镜滂 媾郫邱 谪缘墩 鳄喷修 裨祈柯 褂懔蛱 蹑燮岚 艚皈咎 募汀暾 赶僻睾 痈焚竺 罚捌玉 勰嵊鳅 巫赓滢 猜悠暖 潍镍吒 删毗晰 俳怿饱 托谧梃 抬鞲钮 洇滩悲 毓鸥珩 螈蛾涸 纂髯馑 誉鸱询 艺仅鏊 庠陴谠 职邗雀 懑黠翳 崧磅馓 淬嵘蒋 笑抑尊 坦榆圃 魇纳钏 穗蝶喇 绠钚愣 镢槐敢

慕函数9285021

帮你测试了一下,我采用的是html5lib的解析器,打印的结果是没有问题的,估计是解析器的问题。

慕先生4543078

爬虫又不是通用的。别的网站能爬是你正确解析了它页面中的标签,换个class不就解析不了了么。要是一个爬虫所有网站通用,我就下岗了。

颜鸿羽

应该是你遍历的时候出了问题吧!
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python