我是 BeautifulSoup 和 Python 的新手。我正在抓取一些页面,有时会给出电话号码,有时却没有。如果它在那里,我想刮掉它。HTML 非常简单:
<div>
<p>Email: someone@somewhere.com</p>
<p>Telephone: 1234567890</p>
<p>Postal code: B3H 2F5</p>
</div>
我正在检查电话号码是否存在,如下所示:
phoneNumber = soup.find(string='Telephone:')
if phoneNumber:
phoneNumber = # Some code here to get the actual number
else:
phoneNumber = ('None')
print (phoneNumber)
该 div 中通常还有其他几个 p 标签,但并不总是存在相同的标签,因此我不能依赖它们作为参考点。电话号码也不总是遵循相同的模式。我能做的最好的事情就是确定电话号码始终以“电话:”开头并包含在 ap 标签中。这似乎是找到它的唯一可靠方法。
我不明白的是如何获得实际的电话号码,即
“电话:”后的标签
如何在“电话:”一词后获取此元素中的数字?
交互式爱情
当年话下
相关分类